

## 明細書

## 符号化モード決定装置、画像符号化装置、符号化モード決定方法、および符号化モード決定プログラム

5

## (技術分野)

本発明は、符号化モード決定装置、画像符号化装置、符号化モード決定方法、および符号化モード決定プログラムに関する。

## 10 (背景技術)

マルチメディア・インターネット時代のキー・テクノロジーとして、MPEG-4が注目を集めている。MPEG-4では、移動体通信、インターネットなどの応用領域に対応するため、MPEG-1/2に比べ、符号化効率改善などに特徴を有している（例えば、三木彌一編著、「MPEG-4のすべて」、初版、（株）15 工業調査会、1998年9月30日、p. 37-58参照。）。

MPEG-4では、新しい高能率の符号化方式として、AVCと呼ばれる方式が策定されている。AVCはISO MPEG-4 Part 10 Advanced Video CodingまたはITU-T H.264と呼ばれている符号化方式である。

20 この方式は、動き推定やDCTを $4 \times 4$ ピクセルの画像ブロックでも可能とし、動き推定のための画像を複数のピクチャから選択するなどして符号化効率の向上を図っている。AVCは、これまでの符号化方式に利用されていた技術を取り入れた高機能な符号化方式となっているため、応用領域に適応した最適な利用が課題となっている。

25 例えば、AVC策定以前のMPEG-4では、マクロブロック単位の符号化モードの候補（パーティションサイズ、予測方向、ダイレクトモードなど）の組み合わせ数が比較的少なく、符号化の際にこれらの候補を網羅して最適な符号化モードの探索を行ってもエンコーダでの処理量の負担は大きくなかった。

一方、AVCでは、図25に示す様に、 $16 \times 16$ ピクセル（以下、 $16 \times 1$

6 という) のマクロブロックを  $16 \times 16$ ,  $16 \times 8$ ,  $8 \times 16$ ,  $8 \times 8$  のマクロブロックパーティション (以下、小ブロックという) に分割可能である。また  $8 \times 8$  ピクセルの小ブロックを  $8 \times 8$ ,  $8 \times 4$ ,  $4 \times 8$ ,  $4 \times 4$  のサブマクロブロックパーティションに分割可能である。

5 以下、 $16 \times 16$  に分割された 1 つの小ブロックを小ブロック Sb1 と、 $16 \times 8$  に分割された 2 つの小ブロックを小ブロック Sb2, Sb3 と、 $8 \times 16$  に分割された 2 つの小ブロックを小ブロック Sb4, Sb5 と、 $8 \times 8$  に分割された 4 つの小ブロックを小ブロック Sb6~Sb9 とする。

また、AVC では、図 26 に示す様に、それぞれの小ブロック Sb1~Sb9 について、参照ピクチャを参照して動き推定を行うことが可能である。これは、それぞれのサブマクロブロックパーティションについても同様である。さらに、AVC では、図 27 に示す様に、符号化ピクチャに対して時間的に前の参照ピクチャを参照する前方向予測 (図 27 (a) 参照)、符号化ピクチャに対して時間的に後の参照ピクチャを参照する後方向予測 (図 27 (b) 参照)、あるいは符号化ピクチャに対して双方向の参照ピクチャを参照する双方向予測 (図 27 (c) 参照) などのインター予測を行うことが可能である。

#### 〈従来のエンコーダによる処理〉

これらの符号化モードを網羅する従来のエンコーダの処理を図 28 および図 29 を用いて説明する。

20 従来のエンコーダでは、画像ブロックを複数の分割方法候補で分割した小ブロックの全てについて動き推定を行う。さらに、小ブロック毎の参照ピクチャの選択および画像ブロックの分割方法の選択を行い、選択された分割方法を用いた符号化を行う。

ここで、小ブロック毎の参照ピクチャの選択および画像ブロックの分割方法の選択に際して、符号化コストという量が用いられる。符号化コストとは、画質劣化度 (小ブロックと予測画像との絶対差分和) と動き情報 (動きベクトルあるいは差分動きベクトルなど) の符号量との和で表される量であり、画像ブロック単位の符号化コストが小さいほど、画像ブロックの符号化効率が良いことを示している。なお、絶対差分和以外にも、差分の二乗和や、差分のアダマール変換や D

CT変換後の誤差の絶対値和などが用いられることがある。

図28は、小ブロックのそれぞれに対する動き推定の処理フローを示すブロック図である。16×16の画像ブロックを分割したM×N ((M, N) = (16, 16), (16, 8), (8, 16), (8, 8)) の小ブロックのそれぞれ  
5 に対して、図28の処理が行われる。図28に示す動き推定の処理フローは、小  
ブロックについてのフルペル予測ステップS300と、サブペル予測ステップS  
301と、参照方向選択ステップS302とを備えている。

フルペル予測ステップS300は、M×Nの小ブロックに対して、前方向予測  
および後方向予測による整数画素精度の動き推定を行う（ステップS305, S  
10 306）。具体的には、整数画素精度で、決められた探索範囲内（例えば±3  
2）の動き推定を行う。すなわち、探索範囲内で、符号化コストを最小とする動  
きベクトル（以下、MVという）OfおよびMVObを検出する。

サブペル予測ステップS301は、M×Nの小ブロックに対して、前方向予測、  
後方向予測および双方向予測による非整数画素精度の動き推定を行う（ステップ  
15 S307～S309）。AVCのインター予測では、1/2画素精度や1/4画  
素精度といった非整数画素精度で動き推定を行うことができる。そこで、非整数  
画素精度の参照ピクチャをフィルタを用いて生成し、生成された参照ピクチャに  
対して動き推定が行われる。

前方向予測ステップS307では、2段階の動きベクトル探索により、MV2  
20 fが検出される。具体的には、フルペル予測ステップS300で検出されたMV  
Ofを中心として、周囲8近傍の1/2画素（または1/4画素）と中心のMV  
Ofを含めた9点の中から、符号化コストを最小とするMV1f（図示せず）が  
求められる。さらに、MV1fを中心として、周囲8近傍の1/2画素（または  
1/4画素）と中心のMV1fを含めた9点の中から、符号化コストを最小とす  
25 るMV2fが求められる。なお、フルペル予測では整数画素精度の動き推定を行  
うと書いたが、間引き画素、例えば、水平に1画素間引く、などした場合でも、  
本発明のモード選択の方法が適用可能である。

後方向予測ステップS308でも、前方向予測ステップS307と同様に、フルペル予測ステップS300で検出されたMVObから、MV2bが検出される。

双方向予測ステップS309は、2枚の参照ピクチャを参照するため、処理量が多い。そこで、前方向予測ステップS307および後方向予測ステップS308で検出されたMV2fおよびMV2bを利用した予測が行われる。具体的には、MV2fおよびMV2bが示す参照ピクチャ上の参照領域を平均したものをお5 画像として用いる。

また、前方向予測ステップS307、後方向予測ステップS308および双方向予測ステップS309では、それぞれの符号化コストC0、C1およびC2が導出される。

参照方向選択ステップS302は、符号化コストC0～C2のうち最小の符号10 化コストを有する方向を小ブロックの参照方向として選択するとともに、最小の符号化コストを出力する。

図29は、画像ブロックについての動き推定の処理フローを示すブロック図である。図29の画像ブロックについての動き推定の処理フローは、 $16 \times 16$ の画像ブロックを4種類の分割方法候補により分割した $M \times N$  ( $(M, N) = (15 6, 16), (16, 8), (8, 16), (8, 8)$ ) の小ブロックのそれぞれに対する動き推定を行う動き推定ステップS315と、小ブロックごとの動き推定の結果に基づいて、画像ブロックの符号化コストを分割方法候補毎に導出する符号化コスト換算ステップS316と、分割方法候補毎に導出された画像ブロックの符号化コストから、最良の分割方法を選択する分割方法選択ステップS20 317とを備えている。

動き推定ステップS315は、図28を用いて説明した小ブロックに対する動き推定の処理フローに対応する小ブロック動き推定ステップS320～S323を有している。ここで、図29では、小ブロック動き推定ステップS321～S25 323の処理ブロックは複数の矢印により接続されている。例えば、 $16 \times 8$ の小ブロック動き推定ステップS321では、それぞれの処理ブロックは2本の矢印により接続されている。これは、それぞれの処理が、 $16 \times 16$ の画像ブロックを $16 \times 8$ に分割する2つの小ブロックSb2、Sb3に対して行われることを示している。同様に、 $8 \times 16$ の小ブロック動き推定ステップS322においては、それぞれの処理ブロックは、2本の矢印により接続されており、 $8 \times 8$ の

小ブロック動き推定ステップS 323においては、それぞれの処理ブロックは、4本の矢印により接続されている。それぞれの処理ブロックの処理の内容は、図28で説明したのと同様であるため、ここでは説明を省略する。

符号化コスト換算ステップS 316は、MBコスト換算ステップS 325～S 328を有している。MBコスト換算ステップS 325～S 328は、小ブロック動き推定ステップS 320～323により出力された小ブロック毎の符号化コストを合計し、画像ブロックの符号化コストを分割方法候補毎に導出する。

分割方法選択ステップS 317は、MBコスト換算ステップS 325～S 328が導出した分割方法候補毎の符号化コストのうち、最小の符号化コストを示す分割方法候補を画像ブロックに適用する分割方法として選択する。

また、AVCでは、図30に示す様に、2つの画像ブロック71, 72からなる画像ブロックペア73という概念を導入しており、画像ブロックペア73を単位として、フィールド予測およびフレーム予測を適応的に切り換えることが可能である。例えば、フィールド予測の場合、フィールド構造ブロック75, 76のそれぞれに対して動き推定が行われる。フレーム予測の場合、フレーム構造ブロック77, 78のそれぞれについて動き推定が行われる。

また、画像ブロックペア73の符号化モードは、符号化ピクチャ構造の2種類（フィールド・フレーム）および符号化予測方式（イントラ・インター予測）の2種類で、合計4種類ある。従来は、これらの全ての組み合わせを考慮していたため、処理量多いと言う問題があった。特にイントラ予測の処理負担が大きかった。

ここで、従来の符号化モード決定について説明する。AVCより前のCodecではMB pair（大ブロック）という概念は無く、MB（中ブロック）の種類として、フィールド／フレームがあった。そして、イントラ／インターとフィールド／フレームの4通りを網羅するのが一般的だった。図31に示すように、動き推定ステップS 81と、ピクチャ構造及び符号化予測方式決定ステップS 82とから構成されている。推定ステップS 81は、第1～第6推定ステップS 811～S 816とを有している。第1推定ステップS 811は、フレーム構造ブロックに対してインター予測を行う。第2推定ステップS 812は、フレーム構

造ブロックに対してイントラ予測を行う。第3推定ステップS813は、フィールド構造トップMBに対してインター予測を行う。第4推定ステップS814は、フィールド構造のボトムフィールドに対してインター予測を行う。第3推定ステップS813によって導出された符号化コストと、第4推定ステップS814によって導出された符号化コストは合計されて、フィールド構造ブロックに対してインター予測して導出された符号化コストが得られる。第5推定ステップS815は、フィールド構造のトップフィールドに対してイントラ予測を行う。第6推定ステップS816は、フィールド構造のボトムフィールドに対してイントラ予測を行う。第5推定ステップS815によって導出された符号化コストと、第6推定ステップS816によって導出された符号化コストは合計されて、フィールド構造ブロックに対してイントラ予測して導出された符号化コストが得られる。

ピクチャ構造及び符号化予測方式決定ステップS82は、前記4種類の符号化コストのうち、最小となるものを選択する。

以上までが従来技術であるが、そのような考えを単純にAVCに適用すると考えると、図32のような処理が想定される。図32では、処理全体は、動き推定ステップS81' と、符号化予測方式決定ステップS83と、MBペアのピクチャ構造決定ステップS82' とから構成されている。

動き推定ステップS81' は、第1～第8推定ステップS811' ～S818' を備えている。第1推定ステップS811' はフレーム構造トップMB77に対してインター予測を行い、第2推定ステップS812' はフレーム構造トップMB77に対してイントラ予測を行う。第3推定ステップS813' はフレーム構造ボトムMB78に対してインター予測を行い、第4推定ステップS814' はフレーム構造ボトムMB78に対してイントラ予測を行う。第5推定ステップS815' はフィールド構造トップMB75に対してインター予測を行い、第6推定ステップS816' はフィールド構造トップMB75に対してイントラ予測を行う。第7推定ステップS817' はフィールド構造ボトムMB76に対してインター予測を行い、第8推定ステップS818' はフィールド構造ボトムMB76に対してイントラ予測を行う。

符号化予測方式決定ステップS83は、第1～第4予測方式決定ステップS8

31～S834を備えている。第1予測方式決定ステップS831は、第1推定ステップS811'及び第2推定ステップS812'の符号化コストを比較して、フレーム構造トップMB77に対するイントラ／インターを選択する。第2予測方式決定ステップS832は、第3予測ステップS813'及び第4予測ステップS814'の符号化コストを比較して、フレーム構造ボトムMB78に対するイントラ／インターを選択する。イントラ／インターが選択されたフレーム構造のトップMB77とボトムMB78の符号化コストは合計され、フレーム構造ブロックペア77, 78の符号化コストが得られる。第3予測方式決定ステップS833は、第5推定ステップS815'及び第6推定ステップS816'の符号化コストを比較して、フィールド構造トップMB75に対するイントラ／インターを選択する。第4予測方式決定ステップS834は、第7推定ステップS817'及び第8推定ステップS818'の符号化コストを比較して、フィールド構造ボトムMB76に対するイントラ／インターを選択する。イントラ／インターが選択されたフィールド構造のトップMB75とボトムMB76の符号化コストは合計され、フィールド構造ブロックペア75, 76の符号化コストが得られる。

ピクチャ構造決定ステップS82'は、フレーム構造ブロックペア77, 78の符号化コストとフィールド構造ブロックペア75, 76の符号化コストとを比較し、画像ブロックペア73(71, 72)のフィールド／フレームを決定する。

以上の処理では、イントラ予測とインター予測の両方でフィールド／フレームそれぞれのコスト計算を行うため、インター予測とイントラ予測のいずれか一方のみで圧縮率が向上する画像の場合であっても、圧縮率が最良となるように符号化ピクチャ構造と符号化予測方式を決定できる。しかし、その一方でイントラ予測の回数が多いため、処理量が膨大になる。

## 25 (発明の開示)

以上のように、AVCでは、マクロブロック(ペア)毎に符号化モードの候補が膨大であり、全ての候補を網羅して符号化効率の高い符号化モードを探索すると、エンコーダの処理量の負担が大きくなる。

そこで、本発明では、より少ない処理量で適切な符号化モードの選択を可能と

させる符号化モード決定装置、画像符号化装置、符号化モード決定方法、および符号化モード決定プログラムを提供することを課題とする。

請求項 1 に記載の符号化モード決定装置では、画像ブロックの符号化モードを複数候補の中から少なくとも 1 つに決定する装置であって、簡易動き推定部と、

5 符号化モード選択部と、複雑動き推定部と、符号化モード決定部とを備えている。簡易動き推定部は、各符号化モードによってそれぞれ得られる画像ブロックのパーティションである小ブロックに対する簡易な動き推定に基づいて、各符号化モードの符号化コストを導出する。符号化モード選択部は、簡易動き推定部によって導出された符号化コストに基づいて、複数の符号化モードから一部の符号化モードを選択する。複雑動き推定部は、一部の符号化モードの少なくとも一部の符号化モードによって得られる小ブロックに対する複雑な動き推定に基づいて、各符号化モードの符号化コストを導出する。符号化モード決定部は、複雑動き推定部によって導出された符号化コストに基づいて、画像ブロックの符号化モードを決定する。

15 ここで、複雑な動き推定とは、簡易な動き推定よりも複雑な動き推定のことである（以下、同じ）。例えば、複雑な動き推定とは、整数画素精度の簡易な動き推定に対するより詳細な精度（例えば、1/2 画素精度、1/4 画素精度などといった非整数画素精度）での動き推定、非整数画素の簡易な動き推定に対するより詳細な精度での動き推定、縮小画像（画素情報の間引かれた画像）を参照する簡易な動き推定に対するより詳細な画像を参照する動き推定などである。

20 符号化コストは、例えば、画質劣化度（小ブロックと動き推定における参照ピクチャとの絶対差分和）と動き情報（動きベクトルあるいは差分動きベクトルなど）の符号量との和で表される。符号化モードとは、例えば、小ブロックの分割方法や、小ブロックの動き推定の際のピクチャ参照方向や、小ブロックの符号化ピクチャ構造などである。

25 この装置では、簡易動き推定部により得られた符号化コストから符号化モード選択部が符号化モードの絞り込みを行う。さらに、絞り込んだ符号化モードの小ブロックに対して、複雑動き推定部が複雑な動き推定を行う。ここで、複雑な動き推定は、例えば、フィルタを適用する必要があるなどの理由により、簡易な動

き推定に比して処理量が多いが、この装置では、符号化モードの決定に際して全ての小ブロックについて複雑な動き推定を行う必要が無い。このため、複雑な動き推定の回数を削減でき、符号化モード決定の処理量を低減することが可能となる。また、必要な小ブロックには複雑な動き推定を行うため、適切な符号化効率

5 の符号化モードを決定することが可能となる。

請求項 2 に記載の符号化モード決定装置では、請求項 1 において、簡易動き推定部は、各符号化モードの符号化コストを導出する際に、各符号化モードによって得られる小ブロックごとに複数のピクチャ参照方向の簡易な動き推定を行って符号化コストを算出し、次に各小ブロックごとに符号化コストが低いピクチャ参照方向を選択し、次に選択したピクチャ参照方向に関する全ての小ブロックの符号化コストを各分割方法候補ごとに合計して、各分割方法候補ごとの符号化モードの符号化コストを導出する。

この装置では、簡易動き推定部が各小ブロックごとに符号化コストが低いピクチャ参照方向を選択しているため、各分割方法候補ごとの符号化モードにおいて最も符号化コストが小さい小ブロックの組み合わせが可能となる。

請求項 3 に記載の符号化モード決定装置では、請求項 1 において、簡易動き推定部は、各符号化モードの符号化コストを導出する際に、各符号化モードによって得られる小ブロックごとに複数のピクチャ参照方向の簡易な動き推定を行って符号化コストを算出し、次に小ブロックの各ピクチャ参照方向ごとの符号化コストを画像ブロック単位に換算して、各分割候補の各ピクチャ参照方向ごとの符号化モードの符号化コストを導出する。

この装置では、簡易動き推定部が小ブロックのピクチャ参照方向ごとの符号化コストを画像ブロック単位に換算して符号化モードを導出するため、一つの小ブロックにおいて異なるピクチャ参照方向の符号化モードも符号化モード選択部の

25 対象となる。

請求項 4 に記載の符号化モード決定装置では、請求項 2 又は 3 において、簡易動き推定部の複数のピクチャ参照方向の簡易な動き推定は、時間的に前方向のピクチャを参照する前方向予測と、時間的に後方向のピクチャを参照する後方向予測のみを含む。すなわち、この装置は双方向予測を行わない。なお、前方向予測

と後方向予測は、それぞれ、同一方向における複数枚のピクチャを参照する複数予測を含む（以下、同じ）。

この装置では、簡易動き推定部は、前方向予測と後方向予測のみを行う。双方予測を行わないため、処理量を削減でき、簡易な動き推定の処理時間を短縮で

5 きる。

請求項 5 に記載の符号化モード決定装置では、請求項 2 又は 3 において、簡易動き推定部の複数のピクチャ参照方向の簡易な動き推定は、時間的に前方向のピクチャを参照する前方向予測と、時間的に後方向のピクチャを参照する後方向予測と、時間的に双方向のピクチャを参照する双方向予測とを含む。

10 この装置では、双方向予測を行うため、簡易な動き推定の精度を向上させることができ可能となる。このため、より適切な符号化モードを選択することが可能となる。

請求項 6 に記載の符号化モード決定装置では、請求項 2 又は 3 において、簡易動き推定部の複数のピクチャ参照方向の簡易な動き推定は、時間的に前方向のピクチャを参照する前方向予測と、時間的に後方向のピクチャを参照する後方向予測とを含む。簡易動き推定部は、前方向予測と後方向予測とに基づいて、時間的に双方向のピクチャを参照する双方向予測を行った場合の符号化コストを導出する。例えば、前方向予測の符号化コストと後方向予測の符号化コストとが近い値の場合には、双方向予測の符号化コストは、それらの符号化コストの小さい方の値よりも少しだけ小さい値である、などと推定される。

20 この装置では、双方向予測の予測結果を推定するため、簡易動き推定部では、双方向予測を行う必要はなく、処理量を低減することが可能となる。また、予測結果を簡易動き推定部による符号化コストに反映させることにより、双方向予測を行った場合と同様の効果を簡易に得ることが可能となる。このため、符号化効率を簡易に向上させることが可能となる。

請求項 7 に記載の符号化モード決定装置では、請求項 1 ~ 6 のいずれかにおいて、複雑動き推定部は、簡易動き推定部における簡易な動き推定に基づいて、複雑な動き推定の際のピクチャ参照方向を決定する。複雑動き推定部では、決定された参照方向のピクチャを参照して動き推定を行う。すなわち、前方向予測又は

後方向予測を実行可能な場合であっても、常に全ての方向の動き推定を行う必要が無くなる。

この装置では、必要な参照方向を参照して複雑な動き推定を実行することが可能となる。このため、複雑な動き推定の処理量を削減でき、複雑な動き推定の処理時間を短縮可能となる。

請求項 8 に記載の符号化モード決定装置では、請求項 7 において、複雑動き推定部は、簡易動き推定部における小ブロックに対する簡易な動き推定の結果、前方向予測と後向予測の符号化コストが概ね同じ場合は両方を選択し、異なる場合は符号化コストが小さい方のみを選択する。

この装置では、前方向予測と後向予測の符号化コストが概ね同じ場合は両方を選択し、さらに双方向予測を行うことができる。また、異なる場合は符号化コストが小さい方のみを選択する。これは、一方の符号化コストが大きい場合は、双方向予測で符号化コストが小さくなることが期待できないからである。

請求項 9 に記載の符号化モード決定装置では、請求項 1 ~ 8 のいずれかにおいて、複雑動き推定部は、簡易動き推定部における小ブロックに対する簡易な動き推定に基づいて、一部の符号化モードからさらに少なくとも一部の符号化モードを選択する。複雑動き推定部は、小ブロックに対する簡易な動き推定に基づいて、一部の符号化モードのうちの少なくとも一部の符号化モードを選択する。

この装置では、異なる符号化モードから選択された一部の符号化モードの全部について、複雑な動き推定を行う必要がなく、処理量を削減できる。また、処理量を一定に保つように一部の符号化モードのうちの少なくとも一部の符号化モードを選択することも可能となる。

請求項 10 に記載の符号化モード決定装置では、請求項 9 において、複雑動き推定部は、各符号化モードを符号化コストが低い順に選択していき、選択した符号化モードの符号化コストの和が処理余裕量を超える直前に選択を打ち切る。

この装置では、複雑動き推定部は符号化モード選択部によって選択された符号化モードの全てを選択しないこともあり得るが、その場合でも符号化コストが低い符号化モードは選択されているため問題が少ない。

請求項 11 に記載の符号化モード決定装置では、請求項 1 ~ 10 において、簡

易動き推定部あるいは複雑動き推定部は、動き推定処理の処理量がほぼ一定に保たれるように簡易動き推定あるいは複雑動き推定における動き推定方式を変化させる。

例えば、符号化モード決定装置は、画像ブロックにより構成される画像の画像属性に応じて、動き推定方式を変化させる。ここで、画像属性とは、例えば、画像のサイズや、画像の符号化方式（ピクチャタイプ〔Iピクチャ、Pピクチャ、Bピクチャ〕など）や、画像のフォーマット（走査方式〔プログレッシブ、インターレース〕、色差フォーマットなど）や、画像の動き量などである。

動き推定方式とは、例えば、参照するピクチャの枚数・方向、動き推定を行うパーティションサイズのバリエーション、動きの探索範囲などである。

この装置では、適切な処理量の処理が実現され、装置の可動率が向上する。さらに付随的な効果として、より適切な動き推定を行うことが可能となる。

請求項12に記載の符号化モード決定装置では、請求項1～11において、簡易な動き推定は、整数画素精度の動き推定であり、複雑な動き推定は、非整数画素精度の動き推定である。

この装置では、簡易動き推定部により得られた符号化コストから符号化モード選択部が符号化モードの絞り込みを行う。さらに、絞り込んだ符号化モードの小ブロックに対して、複雑動き推定部が非整数画素精度の動き推定を行う。ここで、非整数画素精度の動き推定はフィルタを適用する必要があって整数画素精度の動き推定に比して処理量が多いが、この装置では、符号化モードの決定に際して全ての小ブロックについて非整数画素精度の動き推定を行う必要が無い。このため、非整数画素精度の動き推定の回数を削減でき、符号化モード決定の処理量を低減することが可能となる。また、必要な小ブロックには非整数画素精度の動き推定を行うため、適切な符号化効率の符号化モードを決定することが可能となる。

請求項13に記載の集積回路は、請求項1～12のいずれかに記載の符号化モード決定装置を含む。

この集積回路では、請求項1～12のいずれかに記載の符号化モード決定装置と同様の効果を得ることができる。

請求項14に記載の画像符号化装置は、請求項1～12のいずれかに記載の符

号化モード決定装置と、符号化装置とを備えている。符号化装置は、符号化モード決定装置が決定する画像ブロックの符号化モードに基づいて、画像ブロックの符号化を行う。

この画像符号化装置では、符号化モードの決定に際して、全てのパーティションについて複雑な動き推定を行う必要が無い。このため、複雑な動き推定の回数を削減でき、符号化モード決定の処理量を低減することが可能となる。また、必要なパーティションには複雑な動き推定を行うため、適切な符号化効率の符号化モードを決定し、符号化を行うことが可能となる。

請求項 15 に記載の集積回路は、請求項 14 に記載の画像符号化装置を含む。

この集積回路では、請求項 14 に記載の画像符号化装置と同様の効果を得ることができる。

請求項 16 に記載の符号化モード決定装置は、画像ブロックの符号化モードを決定する装置であって、インター予測部と、符号化ピクチャ構造決定部と、イントラ予測部と、符号化予測方式決定部とを備えている。インター予測部は、画像ブロックのフィールド構造ブロックおよびフレーム構造ブロックの各ブロックについてインター予測を行って、符号化コストを導出する。符号化ピクチャ構造決定部は、インター予測部による符号化コストに基づいて、画像ブロックの符号化ピクチャ構造を決定する。イントラ予測部は、決定された符号化ピクチャ構造を有する各ブロックについてイントラ予測を行って、符号化コストを導出する。符号化予測方式決定部は、インター予測による符号化コストとイントラ予測による符号化コストを比較して、決定された符号化ピクチャ構造を有する画像ブロックの各ブロックに対する符号化予測方式を決定する。ここで、符号化ピクチャ構造とは、画像ブロックを符号化する際のピクチャ構造であり、フィールド構造又はフレーム構造を意味している。符号化予測方式とは、画像ブロックを符号化する際のインター予測あるいはイントラ予測を意味している。

ここで、フィールド構造ブロックとは、例えば、画像ブロックの奇数ラインの集合により構成されるブロックと偶数ラインの集合により構成されるブロックとを含んでいる（以下、同じ）。フレーム構造ブロックとは、例えば、画像ブロックのラインを順次含むブロックにより構成されている（以下、同じ）。

この装置では、イントラ予測部は符号化ピクチャ構造決定部によって決定された符号化ピクチャ構造の各ブロックについてのみイントラ予測を行うため、イントラ予測部はフィールド構造ブロックおよびフレーム構造ブロックの全てについてイントラ予測を行う必要がない。このように処理負荷の高いイントラ予測の回数を減らすことができるため、画像ブロックの符号化予測方式を決定するための処理負荷を削減できる。

請求項 17 に記載の符号化モード決定装置では、請求項 16 において、インター予測部は、フレーム構造ブロックの各ブロックの符号化コストを合計してフレーム構造ブロックの符号化コストを導出し、フィールド構造ブロックの各ブロックの符号化コストを合計してフィールド構造ブロックの符号化コストを導出する。

この装置では、インター予測部は各ピクチャ構造ごとの各ブロックの符号化コストを導出して合計することで、各ピクチャ構造ごとの符号化コストを導出する。

請求項 18 に記載の符号化モード決定装置では、請求項 17 において、イントラ予測部は、決定された符号化ピクチャ構造を有する各ブロックについてイントラ予測を行って符号化コストを導出する。符号化予測方式決定部は、決定された符号化ピクチャ構造を有する各ブロックについて、インター予測部で導出された符号化コストとイントラ予測部で導出された符号化コストとを比較し、各ブロックごとに符号化予測方式を決定する。

この装置では、イントラ予測部は、決定された符号化ピクチャ構造を有する各ブロックについてイントラ予測を行って符号化コストを導出するため、フィールド構造ブロックおよびフレーム構造ブロックの全てについてイントラ予測を行う必要がない。このように処理負荷の高いイントラ予測の回数を減らすことができるため、画像ブロックの符号化予測方式を決定するための処理負荷を削減でき、さらに符号化装置全体の処理量を低減することが可能となる。

請求項 19 に記載の符号化モード決定装置では、請求項 16 ~ 18 のいずれかにおいて、画像ブロックは、2 つの正方ブロックから構成されているブロックペアである。

この装置では、ブロックペアが2つの正方ブロックから構成されており、フィールド構造ブロックとフレーム構造ブロックとのそれぞれを正方のブロックとして処理することが可能となる。

請求項20に記載の集積回路は、請求項16～19のいずれかに記載の符号化モード決定装置を含む。

この集積回路では、請求項16～19のいずれかに記載の符号化モード決定装置と同様の効果を得ることができる。

請求項21に記載の画像符号化装置は、請求項16～19のいずれかに記載の符号化モード決定装置と、符号化モード決定装置が決定する画像ブロックの符号化モードに基づいて、画像ブロックの符号化を行う符号化装置とを備える。

この装置では、イントラ予測部はピクチャ構造決定部によって決定されたピクチャ構造のブロックについてのみイントラ予測を行うため、イントラ予測部はフィールド構造ブロックおよびフレーム構造ブロックの全てについてイントラ予測を行う必要がない。このように処理負荷の高いイントラ予測の回数を減らすことができるため、画像ブロックの符号化予測方式を決定するための処理負荷を削減できる。

請求項22に記載の集積回路は、請求項21に記載の画像符号化装置を含む。

この集積回路では、請求項21に記載の画像符号化装置と同様の効果を得ることができる。

請求項23に記載の符号化モード決定装置は、画像ブロックの符号化モードを決定する装置であって、簡易動き推定部と、符号化ピクチャ構造決定部とを備えている。簡易動き推定部は、画像ブロックのフィールド構造ブロックおよびフレーム構造ブロックのそれぞれのブロックに対して簡易な動き推定によって符号化コストを導出する。符号化ピクチャ構造決定部は、簡易動き推定部による符号化コストに基づいて、画像ブロックのフィールド構造ブロックおよびフレーム構造ブロックの符号化コストを比較し、符号化ピクチャ構造を決定する。

この装置では、簡易な動き推定に基づいて、画像ブロックの符号化モード（具体的には、符号化ピクチャ構造）を決定する。このため、符号化モードを決定するための処理量を軽減することが可能となる。

請求項 2 4 に記載の符号化モード決定装置では、請求項 2 3 において、簡易動き推定部は、各ブロックに対して簡易なインター予測と簡易なイントラ予測を行い、次に簡易なインター予測の符号化コストと簡易なイントラ予測の符号化コストを比較し各ブロックごとに簡易なインター予測と簡易なイントラ予測のいずれかを選択し、さらに各ピクチャ構造ごとのブロックの符号化コストを合計してフレーム構造ブロック及びフィールド構造ブロックの符号化コストを導出する。

この装置では、簡易動き推定部がインター予測とイントラ予測を用いてフレーム構造ブロック及びフィールド構造ブロックの符号化コストを導出するため、インター予測又はイントラ予測のいずれかで圧縮率が向上する画像ブロックの場合でも圧縮率が最良となるような符号化ピクチャ構造を決定できる。

請求項 2 5 に記載の符号化モード決定装置では、請求項 2 4 において、簡易なインター予測は、整数画素精度のインター予測である。

この装置では、簡易動き推定部では、整数画素精度のインター予測と簡易なイントラ予測とを行うことできる。

請求項 2 6 に記載の符号化モード決定装置は、請求項 2 3 ～ 2 5 のいずれかにおいて、画像ブロックは、2つの正方ブロックから構成されているブロックペアである。

この装置では、ブロックペアが2つの正方ブロックから構成されており、フィールド構造ブロックとフレーム構造ブロックとのそれを正方のブロックとして処理することが可能となる。

請求項 2 7 に記載の集積回路は、請求項 2 3 ～ 2 6 のいずれかに記載の符号化モード決定装置を含む。

この集積回路により、請求項 2 3 ～ 2 6 のいずれかに記載の符号化モード決定装置と同様の効果を得ることができる。

請求項 2 8 に記載の画像符号化装置は、請求項 2 3 ～ 2 6 のいずれかに記載の符号化モード決定装置と、符号化モード決定装置によって決定される符号化ピクチャ構造の画像ブロックに対して複雑な動き推定を行う複雑動き推定部と、複雑動き推定部による予測結果に基づいて、画像ブロックの符号化を行う符号化部とを備える。

この装置では、複雑な動き推定によって画像ブロックの符号化を行うため、圧縮効率が向上する。しかも、ここでは、符号化モード決定装置によって決定された符号化ピクチャ構造の画像ブロックに対してのみ複雑な動き推定を行うため、従来より複雑な動き推定の回数を減らすことができる。

5 請求項 29 に記載の画像符号化装置では、請求項 28 において、複雑予測部は、決定された符号化ピクチャ構造を有する各ブロックに対して、複雑なインター予測又は複雑なイントラ予測を行う。

この装置では、インター予測又はイントラ予測のいずれかで圧縮率が向上する画像ブロックに対しても、圧縮効率を向上させることができる。

10 請求項 30 に記載の画像符号化装置では、請求項 29 において、複雑なインター予測は、非整数画素精度のインター予測である。

この装置では、非整数画素精度のインター予測を用いて複雑なインター予測を行うことが可能となる。

15 請求項 31 に記載の集積回路は、請求項 28 ~ 30 のいずれかに記載の画像符号化装置を含む。

この集積回路により、請求項 28 ~ 30 のいずれかに記載の画像符号化装置と同様の効果を得ることができる。

20 請求項 32 に記載の符号化モード決定方法は、画像ブロックの符号化モードを複数候補の中から少なくとも 1 つに決定する符号化モード決定方法であって、簡易動き推定ステップと、符号化モード選択ステップと、複雑動き推定ステップと、符号化モード決定ステップとを備えている。簡易動き推定ステップは、各符号化モードによってそれぞれ得られる画像ブロックのパーティションである小ブロックに対する簡易な動き推定に基づいて、各符号化モードの符号化コストを導出する。符号化モード選択ステップは、簡易動き推定ステップによって導出された符号化コストに基づいて、複数の符号化モードから一部の符号化モードを選択する。複雑動き推定ステップは、一部の符号化モードの少なくとも一部の符号化モードによって得られる小ブロックに対する複雑な動き推定に基づいて、各符号化モードの符号化コストを導出する。符号化モード決定ステップは、複雑動き推定ステップによって導出された符号化コストに基づいて、画像ブロックの符号化モードを決定する。

ードを決定する。

この方法では、簡易動き推定ステップにより得られた符号化コストから符号化モード選択ステップが符号化モードの絞り込みを行う。さらに、絞り込んだ符号化モードの小ブロックに対して、複雑動き推定ステップが複雑な動き推定を行う。

5 ここで、複雑な動き推定は、例えば、フィルタを適用する必要があるなどの理由により、簡易な動き推定に比して処理量が多いが、この方法では、符号化モードの決定に際して全ての小ブロックについて複雑な動き推定を行う必要が無い。このため、複雑な動き推定の回数を削減でき、符号化モード決定の処理量を低減することが可能となる。また、必要な小ブロックには複雑な動き推定を行うため、  
10 適切な符号化効率の符号化モードを決定することが可能となる。

請求項 3 3 に記載の符号化モード決定方法は、画像ブロックの符号化モードを決定する符号化モード決定方法であって、インター予測ステップと、符号化ピクチャ構造決定ステップと、イントラ予測ステップと、符号化予測方式決定ステップとを備えている。インター予測ステップは、画像ブロックのフィールド構造ブロックおよびフレーム構造ブロックの各ブロックについてインター予測を行って、符号化コストを導出する。符号化ピクチャ構造決定ステップは、インター予測ステップによる符号化コストに基づいて、画像ブロックの符号化ピクチャ構造を決定する。イントラ予測ステップは、決定された符号化ピクチャ構造を有する各ブロックについてイントラ予測を行って、符号化コストを導出する。符号化予測方式決定ステップは、インター予測による符号化コストとイントラ予測による符号化コストを比較して、決定された符号化ピクチャ構造を有する画像ブロックの各ブロックに対する符号化予測方式を決定する。

この方法では、イントラ予測ステップは符号化ピクチャ構造決定ステップによって決定された符号化ピクチャ構造の各ブロックについてのみイントラ予測を行うため、イントラ予測ステップはフィールド構造ブロックおよびフレーム構造ブロックの全てについてイントラ予測を行う必要がない。このように処理負荷の高いイントラ予測の回数を減らすことができるため、画像ブロックの符号化予測方式を決定するための処理負荷を削減できる。

請求項 3 4 に記載の符号化モード決定方法は、画像ブロックの符号化モードを

決定する符号化モード決定方法であって、簡易動き推定ステップと、符号化ピクチャ構造決定ステップとを備えている。簡易動き推定ステップは、画像ブロックのフィールド構造ブロックおよびフレーム構造ブロックのそれぞれのブロックに対して簡易な動き推定によって符号化コストを導出する。符号化ピクチャ構造決定ステップは、簡易動き推定ステップによる符号化コストに基づいて、画像ブロックのフィールド構造ブロックおよびフレーム構造ブロックの符号化コストを比較し、符号化ピクチャ構造を決定する。

この方法では、簡易な動き推定に基づいて、画像ブロックの符号化モード（具体的には、符号化ピクチャ構造）を決定する。このため、符号化モードを決定するための処理量を軽減することが可能となる。

請求項 3 5 に記載の符号化モード決定プログラムは、コンピュータに以下の方法を行わせる。符号化モード決定方法は、画像ブロックの符号化モードを複数候補の中から少なくとも 1 つに決定する符号化モード決定方法であって、簡易動き推定ステップと、符号化モード選択ステップと、複雑動き推定ステップと、符号化モード決定ステップとを備えている。簡易動き推定ステップは、各符号化モードによってそれぞれ得られる画像ブロックのパーティションである小ブロックに対する簡易な動き推定に基づいて、各符号化モードの符号化コストを導出する。符号化モード選択ステップは、簡易動き推定ステップによって導出された符号化コストに基づいて、複数の符号化モードから一部の符号化モードを選択する。複雑動き推定ステップは、一部の符号化モードの少なくとも一部の符号化モードによって得られる小ブロックに対する複雑な動き推定に基づいて、各符号化モードの符号化コストを導出する。符号化モード決定ステップは、複雑動き推定ステップによって導出された符号化コストに基づいて、画像ブロックの符号化モードを決定する。

このプログラムでは、簡易動き推定ステップにより得られた符号化コストから符号化モード選択ステップが符号化モードの絞り込みを行う。さらに、絞り込んだ符号化モードの小ブロックに対して、複雑動き推定ステップが複雑な動き推定を行う。ここで、複雑な動き推定は、例えば、フィルタを適用する必要があるなどの理由により、簡易な動き推定に比して処理量が多いが、このプログラムでは、

符号化モードの決定に際して全ての小ブロックについて複雑な動き推定を行う必要が無い。このため、複雑な動き推定の回数を削減でき、符号化モード決定の処理量を低減することが可能となる。また、必要な小ブロックには複雑な動き推定を行うため、適切な符号化効率の符号化モードを決定することが可能となる。

5 請求項 3 6 に記載の符号化モード決定プログラムは、コンピュータに以下の方法を行わせる。符号化モード決定方法は、画像ブロックの符号化モードを決定する符号化モード決定方法であって、インター予測ステップと、符号化ピクチャ構造決定ステップと、イントラ予測ステップと、符号化予測方式決定ステップとを備えている。インター予測ステップは、画像ブロックのフィールド構造ブロックおよびフレーム構造ブロックの各ブロックについてインター予測を行って、符号化コストを導出する。符号化ピクチャ構造決定ステップは、インター予測ステップによる符号化コストに基づいて、画像ブロックの符号化ピクチャ構造を決定する。イントラ予測ステップは、決定された符号化ピクチャ構造を有する各ブロックについてイントラ予測を行って、符号化コストを導出する。符号化予測方式決定ステップは、インター予測による符号化コストとイントラ予測による符号化コストを比較して、決定された符号化ピクチャ構造を有する画像ブロックの各ブロックに対する符号化予測方式を決定する。

このプログラムでは、イントラ予測ステップは符号化ピクチャ構造決定ステップによって決定された符号化ピクチャ構造の各ブロックについてのみイントラ予測を行うため、イントラ予測ステップはフィールド構造ブロックおよびフレーム構造ブロックの全てについてイントラ予測を行う必要がない。このように処理負荷の高いイントラ予測の回数を減らすことができるため、画像ブロックの符号化予測方式を決定するための処理負荷を削減できる。

請求項 3 7 に記載の符号化モード決定プログラムは、コンピュータに以下の方法を行わせる。符号化モード決定方法は、画像ブロックの符号化モードを決定する符号化モード決定方法であって、簡易動き推定ステップと、符号化ピクチャ構造決定ステップとを備えている。簡易動き推定ステップは、画像ブロックのフィールド構造ブロックおよびフレーム構造ブロックのそれぞれのブロックに対して簡易な動き推定によって符号化コストを導出する。符号化ピクチャ構造決定ス

テップは、簡易動き推定ステップによる符号化コストに基づいて、画像ブロックのフィールド構造ブロックおよびフレーム構造ブロックの符号化コストを比較し、符号化ピクチャ構造を決定する。

このプログラムでは、簡易な動き推定に基づいて、画像ブロックの符号化モード（具体的には、符号化ピクチャ構造）を決定する。このため、符号化モードを決定するための処理量を軽減することが可能となる。

以上、本発明では、より少ない処理量で適切な符号化モードの選択を可能とする符号化モード決定装置、画像符号化装置、符号化モード決定方法、および符号化モード決定プログラムを提供することができる。

10

#### （図面の簡単な説明）

図1は、本発明の一実施形態に係る画像符号化装置の構成図である。

図2は、本発明に係る動き推定部の処理フローチャートである。

図3は、本発明に係る動き推定部の処理フローを示す図である。

15 図4は、本発明に係る分割候補選択部による分割候補の選択方法を示す図である。

図5は、フルペル予測部の処理フローを示す図である。

図6は、フルペル予測部の処理フローを示す図である。

図7は、フルペル予測部の処理フローの変形例を示す図である。

20 図8は、フルペル予測部の処理フローの変形例を示す図である。

図9は、フルペル予測部及び分割候補選択部の処理フローの変形例を示す図である。

図10は、符号化コスト換算部と分割候補選択部による符号化コスト換算及び分割候補の選択方法を示す図である。

25 図11は、フルペル予測部と符号化コスト換算部の処理フローの変形例を示す図である。

図12は、本発明の第1実施形態にかかる処理フローチャートである。

図13は、本発明の第1実施形態に係るサブペル予測部の処理フローチャートである。

図14は、サブペル予測の一処理量配分例を示す図である。

図15は、サブペル予測の一処理量配分例を示す図である。

図16は、本発明の第2実施形態に係る画像符号化装置の構成図である。

図17は、イントラ予測部、動き推定部、符号化モード決定部の処理フローを5示す図である。

図18は、本発明の第2実施形態にかかる処理フローチャートである。

図19は、本発明の第3実施形態に係る画像符号化装置の構成図である。

図20は、イントラ予測部、動き推定部、符号化モード決定部の処理フローを示す図である。

図21は、コンテンツ供給システムの全体構成を示すブロック図である。

図22は、動画像符号化方法、動画像復号化方法を用いた携帯電話の例である。

図23は、携帯電話のブロック図である。

図24は、ディジタル放送用システムの例である。

図25は、従来のマクロブロックの分割方法候補を示す図である。

図26は、従来のマクロブロックの分割方法候補による符号化ピクチャと参照ピクチャとの関係を示す図である。

図27は、従来のマクロブロックの予測方向を示す図である。

図28は、従来の動き推定の処理フローを示す図である。

図29は、従来の動き推定の処理フローを示す図である。

図30は、MPEG-4 AVCにおける画像ブロックペアの概念を説明するための図である。

図31は、従来の符号化ピクチャ構造決定及び符号化予測方式決定の処理フローを示す図である。

図32は、従来技術ではないが、MPEG-4 AVCに従来の技術を適用した25と想定した場合の符号化ピクチャ構造決定及び符号化予測方式決定の処理フローを示す図である。

(発明を実施するための最良の形態)

[第1実施形態]

図1～図15を用いて、本発明の第1実施形態としてのエンコーダについて説明する。

図1は、本発明の第1実施形態としてのエンコーダ1の構造を説明するブロック図である。エンコーダ1は、例えば、入力画像信号30をMPEG-4符号化し、符号化画像信号31として出力する画像符号化装置であり、パソコンコンピュータ(PC)、携帯電話などにおいて備えられる。

#### 〈エンコーダ1の構成〉

図1に示すエンコーダ1は、入力画像信号30のイントラ予測を行うイントラ予測部2と、入力画像信号30のインター予測を行うインター予測部3と、イントラ予測およびインター予測の予測結果を切り換える切換部4と、切換部4の出力を符号化して符号化画像信号31を出力する符号化部5と、入力画像信号30のローカルデコード信号32を作成する参照画像作成部6とを備えている。

イントラ予測部2は、入力画像信号30を画像ブロック毎にイントラ予測し、イントラ予測画像との差分信号を切換部4に出力する。

インター予測部3は、入力画像信号30を第1の入力とし、ローカルデコード信号32を第2の入力として、インター予測結果を切換部4に出力する。さらに、インター予測部3は、インター予測結果のうち、動きベクトルなど符号化にかかる情報を第2の出力として符号化部5に出力する。

インター予測部3は、入力画像信号30を第1の入力、ローカルデコード信号32を第2の入力とし、動き推定を行う動き推定部10と、動き推定部10の出力を第1の入力、ローカルデコード信号32を第2の入力とし、予測画像を出力する予測画像作成部11と、入力画像信号30を第1の入力、予測画像作成部11の出力を第2の入力とする減算部12とから構成されている。また、動き推定部10の出力のうち、動きベクトルや符号化モードなどの符号化情報は、後述する可変長符号化部22の入力にも与えられる。

動き推定部10は、主に、フルペル予測部13と、分割方法候補選択部14と、サブペル予測部15と、分割方法決定部16とを備えている(動作については、後述)。

切換部4は、イントラ予測結果を第1の入力、インター予測結果を第2の入力

とし、いずれかの入力を符号化部5に出力する。

符号化部5は、切換部4の出力を第1の入力とし、DCT (Discrete Cosine Transform) 部20、量子化部21、可変長符号化部22を通して符号化画像信号31を出力する。

5 参照画像作成部6では、逆量子化部23には量子化部21の出力が入力され、逆量子化部23の出力は、逆DCT部24を通して、加算部25の第1の入力に与えられる。加算部25は、予測画像作成部11の出力を第2の入力とし、加算結果をメモリ26に出力する。メモリ26は、予測画像作成部11の第2の入力と動き推定部10の第2の入力にローカルデコード信号32を出力する。

10 <エンコーダ1の動作>

次に、エンコーダ1の動作について説明する。まず、入力画像信号30は、符号化処理の基本単位である画像ブロックを単位として入力されている。

15 イントラ符号化される画像ブロックは、イントラ予測部2において、同一ピクチャ内の他の画像ブロックの画素係数を用いてイントラ予測される。イントラ予測された画像ブロックは、DCT部20において離散コサイン変換(DCT)を施され、量子化部21において量子化され、可変長符号化部22において可変長符号化される。

一方、量子化部21において量子化されたDCT係数は、逆量子化部23において逆量子化され、逆DCT部24において逆DCTされ、ローカルデコードされ、ローカルデコード信号32としてメモリ26に記憶される。このメモリ26に記憶されたローカルデコード信号32は、インター予測部3において画像ブロックがインター符号化される際に使用される。

20 インター符号化される画像ブロックは、動き推定部10において、動き推定される。ここで、動き推定部10の詳しい動作については後述する。

25 予測画像作成部11は、動き推定部10の動き推定の結果と、メモリ26に記憶されたローカルデコード信号32とに基づいて、予測画像を作成する。減算部12は、画像ブロックと作成された予測画像との差分から差分画像ブロックを求める。差分画像ブロックは、DCT部20において離散コサイン変換を施され、量子化部21において量子化される。離散コサイン変換および量子化された差分

画像ブロックは、動き推定の結果などとともに可変長符号化部22において可変長符号化される。

〈動き推定部10の動作〉

動き推定部10は、画像ブロックの符号化コストを最小とする画像ブロックの

5 符号化モード（画像ブロックの分割方法、予測方向など）を決定するとともに、動きベクトルの導出を行う。

図2を用いて、動き推定部10の特徴について説明する。動き推定部10は、画像ブロックの全てのパーティションサイズおよび動き推定の際の全ての参照ピクチャに対して、整数画素精度の動き推定を行う（ステップS701～S703）。さらに、整数精度の動き推定の結果に基づいて、符号化コストを小さくするパーティションサイズと参照ピクチャとの候補を選択し、選択された候補に対して非整数画素精度の動き推定を行う（ステップS704）。

これにより、全てのパーティションサイズおよび全ての参照ピクチャに対して非整数画素精度の動き推定を行う必要なく、符号化の際のパーティションサイズおよび参照ピクチャを決定するための処理量を低減することが可能となる。また、選択された候補に対しては非整数画素精度の動き推定を行うため、適切な符号化効率を実現することが可能となる。

図3を用いて、動き推定部10の動作についてさらに説明を加える。

図3は、画像ブロックについての符号化モード決定の処理フローを示すブロック図である。図3の画像ブロックについての符号化モード決定の処理フローは、フルペル予測部13により実行されるフルペル予測ステップS41と、分割方法候補選択部14により実行される分割方法候補選択ステップS42と、サブペル予測部15により実行されるサブペル予測ステップS43と、分割方法決定部16により実行される分割方法決定ステップS44とから構成されている。

25 フルペル予測ステップS41は、小ブロックフルペル予測ステップS45と、予測方向選択ステップS46と、符号化コスト導出ステップS47とを備えている。

小ブロックフルペル予測ステップS45は、 $16 \times 16$ の画像ブロックを4種類の分割方法候補により分割した $M \times N$  ( $(M, N) = (16, 16), (16,$

8), (8, 16), (8, 8) の小ブロック Sb1～Sb9 (図25参照) のそれに対して、整数画素精度の動き推定を行い、小ブロック毎の符号化コストおよび動きベクトルを導出する。具体的には、それぞれの小ブロック Sb1～Sb9 に対して、前方向予測ステップ S451～S454 および後方向予測ステップ S455～S458 が行われている。すなわち、前方向予測ステップ S451～S454 および後方向予測ステップ S455～S458 では、それぞれの分割方法候補により分割された小ブロックの個数に応じた回数の処理が行われている。図3では、この回数を処理ブロックからの矢印の本数で表している。

予測方向選択ステップ S46 は、フルペル予測ステップ S45 によって導出された符号化コストに基づいて、複数の符号化モードから一部の符号化モードを選択する。予測方向選択ステップ S46 は、具体的には、前方向予測ステップ S451～S454 の符号化コストと後方向予測ステップ S455～S458 の符号化コストとを比較して、小ブロック毎の符号化コストを小さくする予測方向 (ピクチャ参照方向) を選択する。

符号化コスト導出ステップ S47 は、予測方向選択ステップ S46 が選択した予測方向の符号化コストを分割方法候補毎に合計し、画像ブロック単位での符号化コストを導出する。ここでは、フルペル予測ステップ S45 が各小ブロックごとに符号化コストが低いピクチャ参照方向を選択しているため、各分割方法候補ごとの符号化モードにおいて最も符号化コストが低い小ブロックの組み合わせが可能となる。

分割方法候補選択ステップ S42 は、符号化コスト導出ステップ S47 が導出した画像ブロック単位での符号化コストを比較し、符号化コストが小さい2種類の分割方法候補を選択する。

サブペル予測ステップ S43 は、分割方法候補選択ステップ S42 において選択された2種類の分割方法候補により分割された小ブロックのそれについて、非整数画素精度の動き推定を行う。ここで、非整数画素精度の動き推定は、図28 を用いて説明したサブペル予測ステップ S301 と同様に行われる。すなわち、選択された2種類の分割方法候補により分割された小ブロックのそれについて、小ブロックフルペル予測ステップ S45 で導出された動きベクトルに基づい

て、非整数画素精度の動き推定を行う。また、サブペル予測ステップS 4 3では、小ブロックのそれぞれについて、前方向予測ステップS 4 3 1, S 4 3 4と、後方向予測ステップS 4 3 2, S 4 3 5と、双方向予測ステップS 4 3 3, S 4 3 6とが行われる。この結果、それぞれの小ブロックについて、3種類の予測方向5についての符号化コストが導出される。また、前方向予測ステップS 4 3 1, S 4 3 4と、後方向予測ステップS 4 3 2, S 4 3 5と、双方向予測ステップS 4 3 3, S 4 3 6は、選択された2種類の分割方法候補により分割された小ブロックの個数に応じた回数の処理が行われている。

分割方法決定ステップS 4 4は、分割方法候補選択ステップS 4 2において選10択された2種類の分割方法候補により分割されたそれぞれの小ブロックについて最小となる符号化コストから、小ブロックごとの予測方向を決定するとともに、画像ブロック単位での符号化コストを導出する。さらに、導出された画像ブロック単位での符号化コストを2種類の分割方法候補について比較し、最小の符号化コストを有する分割方法候補を画像ブロックの分割方法として決定する。また、15同時に小ブロックについての動きベクトルが得られる。

図4を用いて、フルペル予測ステップS 4 1と分割方法候補選択ステップS 4 2との処理について詳しい説明を加える。なお、上述の様に、フルペル予測ステップS 4 1は、小ブロックフルペル予測ステップS 4 5と、予測方向選択ステップS 4 6と、符号化コスト導出ステップS 4 7とを備えている。

小ブロックフルペル予測ステップS 4 5は、小ブロックS b 1～S b 9の全て20に対して、整数画素精度の前方向予測（図4では、fwと記載）と後方向予測（図4では、bwと記載）を行い、それぞれの参照方向に対する符号化コストを導出する。図4では、それぞれの符号化コストを例示している。例えば、小ブロックS b 2では、前方向予測の符号化コストが（21）、後方向予測の符号化コ25ストが（22）である。

予測方向選択ステップS 4 6は、小ブロック毎に前方向予測と後方向予測との符号化コストを比較して、符号化コストがより小さい予測方向を選択する。例えば、小ブロックS b 2では、前方向予測が選択される。

符号化コスト導出ステップ S 4 7 は、予測方向選択ステップ S 4 6 が選択した小ブロック毎の符号化コストから画像ブロック単位での符号化コストを導出する。例えば、 $16 \times 8$  の分割方法について、小ブロック S b 2 では、前方向予測が選択され、小ブロック S b 3 では、後方向予測が選択されているため、 $16 \times 16$  の画像ブロック単位での符号化コストは、(4 1) となる。

分割方法候補選択ステップ S 4 2 では、フルペル予測ステップ S 4 1 により導出された画像ブロック単位での符号化コストを分割方法候補毎に比較し、符号化コストが小さい 2 種類の分割方法候補を選択する。図 4 では、 $16 \times 16$  の分割方法（符号化コスト (4 0)）および $16 \times 8$  の分割方法（符号化コスト (4 1)）が分割方法候補として選択される。

#### 〈エンコーダ 1 の効果〉

エンコーダ 1 では、フルペル予測ステップ S 4 1 により得られた符号化コストから分割方法候補選択ステップ S 4 2 が分割方法候補の絞り込みを行う。さらに、絞り込んだ分割候補の小ブロックに対して、サブペル予測ステップ S 4 3 がサブペル予測を行う。ここで、サブペル予測はフィルタを適用する必要があってフルペル予測に比して処理量が多いが、この装置では、符号化モードの決定に際して全ての小ブロック S b 1 ~ S b 9 についてサブペル予測を行う必要が無い。このため、サブペル予測の回数を削減でき、符号化モード決定の処理量を低減することが可能となる。また、必要な小ブロックにはサブペル予測を行うため、適切な符号化効率の符号化モードを決定することが可能となる。

#### 〈エンコーダ 1 の変形例〉

本発明はかかる上記実施形態に限定されるものではなく、本発明の範囲を逸脱することなく種々の変形又は修正が可能である。

##### (1) フルペル予測部 1 3 の変形例

25 (1-1)

上記実施形態では、フルペル予測ステップ S 4 1 を実行するフルペル予測部 1 3 は、それぞれの小ブロック S b 1 ~ S b 9 に対して、前方向予測ステップ S 4 5 1 ~ S 4 5 4 および後方向予測ステップ S 4 5 5 ~ S 4 5 8 を実行すると説明

した（以下、第1フルペル予測方法という）。この場合は、双方向予測を行わないため、処理量を削減でき、フルペル予測の処理時間を短縮できる。

ここで、フルペル予測ステップS41は、さらに双方向予測を実行し符号化コストを導出するものであっても良い（以下、第2フルペル予測方法という）。こ

5 の場合は、双方向予測を行うため、フルペル予測の精度を向上させることが可能となる。このため、より適切な符号化モードを選択することが可能となる。また、前方向予測ステップS451～S454および後方向予測ステップS455～S458により導出された符号化コストから双方向予測を実行した場合の符号化コストを推定するものであっても良い（以下、第3フルペル予測方法という）。

10 この装置では、双方向予測の予測結果を推定するため、フルペル予測部13では、双方向予測を行う必要はなく、処理量を低減することが可能となる。また、予測結果をフルペル予測部13による符号化コストに反映させることにより、双方向予測を行った場合と同様の効果を簡易に得ることが可能となる。このため、符号化効率を簡易に向上させることが可能となる。

15 図5を用いて、 $16 \times 16$ の画像ブロックを2つに分割した $8 \times 16$ の小ブロックSb4および小ブロックSb5（図25参照）に対して実行される第1～第3フルペル予測方法について説明する。

図5（a）は、第1フルペル予測方法について説明する処理フローである。第1フルペル予測方法では、小ブロックSb4, Sb5に対する前方向予測ステップS453および後方向予測ステップS457とが行われ、小ブロックSb4, Sb5についての前方向予測ステップS453による符号化コストC4f, C5fと、小ブロックSb4, Sb5についての後方向予測ステップS457による符号化コストC4b, C5bとが導出される。導出された符号化コストC4f, C5f, C4b, C5bは、小ブロックごとの予測方法選択ステップS46である小ブロック予測方法選択ステップS463（図3参照）において、小ブロックごとに比較され、小さい符号化コストを有する予測方向が選択される。より具体的には、小ブロック予測方法選択ステップS463内の比較ステップS463aにおいて、小ブロックSb4についての符号化コストC4fとC4bとが比較され、比較ステップS463bにおいて、小ブロックSb5についての符号化コス

ト  $C_5^f$  と  $C_5^b$  とが比較され、それぞれの小ブロックについて、より小さい符号化コストを有する予測方向が選択される。

図5 (b) は、第2フルペル予測方法について説明する処理フローである。第1フルペル予測方法との違いは、双方向予測ステップS459が行われる点である。例えば、小ブロック  $S_b^4$  について、前方向予測ステップS453および後方向予測ステップS457で検出された動きベクトルである  $MV_4^f$  と  $MV_4^b$  とを利用した予測が行われる。具体的には、 $MV_4^f$  および  $MV_4^b$  が示す参照ピクチャ上の参照領域を平均して予測画像とし、双方向予測ステップS459の符号化コスト  $C_4^g$  が導出される。小ブロック  $S_b^5$  についても同様に、 $MV_5^f$  と  $MV_5^b$  とを利用して、符号化コスト  $C_5^g$  が導出される。

導出された双方向予測ステップS459の符号化コスト  $C_4^g$ ,  $C_5^g$  は、小ブロック予測方法選択ステップS463の変形例としての小ブロック予測方法選択ステップS465において、前方向予測ステップS453および後方向予測ステップS457の符号化コスト  $C_4^f$ ,  $C_5^f$ ,  $C_4^b$ ,  $C_5^b$  と比較される。具体的には、比較ステップS465aにおいて、小ブロック  $S_b^4$  についての符号化コスト  $C_4^f$ ,  $C_4^b$ ,  $C_4^g$  が比較され、比較ステップS465bにおいて、小ブロック  $S_b^5$  についての符号化コスト  $C_5^f$ ,  $C_5^b$ ,  $C_5^g$  が比較される。この結果、それぞれの小ブロックについての最小の符号化コストを有する予測方向が選択される。

第2フルペル予測方法では、小ブロックについてより正確な動き検出が可能となり、符号化効率の向上が期待できる。

図5 (c) は、第3フルペル予測方法について説明する処理フローである。第1フルペル予測方法との違いは、双方向予測を行った場合の符号化コストの符号化コスト推定ステップS468が行われる点である。

符号化コスト推定ステップS468は、前方向予測ステップS453および後方向予測ステップS457の符号化コスト  $C_4^f$ ,  $C_5^f$ ,  $C_4^b$ ,  $C_5^b$  から、双方向予測を行った場合の符号化コストの推定値である推定符号化コスト  $C_4^h$  および  $C_5^h$  を導出する。具体的には、小ブロック  $S_b^4$  についての符号化コスト  $C_4^f$  と  $C_4^b$  とが「近い値」のときに、推定符号化コスト  $C_4^h$  は、符号化

コスト  $C4_f$  と  $C4_b$  との小さい方よりも少しだけ小さい、例えば、小さい方の値の 9 割の値など、と推定される。

ここで、「近い値」とは、例えば、式  $abs([C4_f] - [C4_b]) * K < abs(abs([C4_f]) + abs([C4_b]))$  が真の時に、符号化コスト  $C4_f$  と  $C4_b$  とが「近い値」と判定される。ここで、 $[C4_f]$ 、 $[C4_b]$  は、符号化コスト  $C4_f$ 、 $C4_b$  の値を示し、 $K$  は、所定の定数である。

さらに、推定符号化コスト  $C4_h$ 、 $C5_h$  は、比較ステップ  $S463a$ 、 $S463b$  の変形例としての比較ステップ  $S466a$ 、 $S466b$  において、符号化コスト  $C4_f$ 、 $C5_f$ 、 $C4_b$ 、 $C5_b$  と比較される。具体的には、比較ステップ  $S466a$  において、推定符号化コスト  $C4_h$  および符号化コスト  $C4_f$ 、 $C4_b$  の比較が行われ、比較ステップ  $S466b$  において、推定符号化コスト  $C5_h$  および符号化コスト  $C5_f$ 、 $C5_b$  の比較が行われる。この結果、それぞれの小ブロックについての最小の符号化コストを有する予測方向が選択される。

第 3 フルペル予測方法では、双方向予測を行う必要はなく、処理量を低減することが可能となる。また、双方向予測を行った場合と同様の効果を簡易に得ることが可能となる。このため、符号化効率を簡易に向上させることが可能となる。

#### (1-2)

上記実施形態において、小ブロックフルペル予測ステップ  $S45$  と予測方向選択ステップ  $S46$  とは、逐次処理されるものであっても、並列処理されるものであってもよい。

図 6 を用いて、 $16 \times 16$  の画像ブロックを 1 つに分割した  $16 \times 16$  の小ブロック  $Sb1$  (図 25 参照) に対する小ブロックフルペル予測ステップ  $S45$  と予測方向選択ステップ  $S46$  との処理順序について説明する。

図 6 (a) は、小ブロックフルペル予測ステップ  $S45$  と予測方向選択ステップ  $S46$  とを逐次処理する場合の処理フローを示している。詳しい説明は、図 3 を用いて上記実施形態において行ったので省略する。

図 6 (b) は、小ブロックフルペル予測ステップ  $S45$  と予測方向選択ステップ  $S46$  とを並列処理する場合の処理フローを示している。ここでは、前方向予測ステップ  $S451$  と後方向予測ステップ  $S455$  とそれぞれの符号化コストの

比較が並列実行される。具体的には、エンコーダ1のメモリ26に前方向予測ステップS451および後方向予測ステップS455のために2枚の参照ピクチャを格納し、並列に動き推定および符号化コスト計算を実行する。最初の数回のコスト計算の最良値を比較し、符号化コストが大きい参照方向の動き推定を打ち切  
5 る。

通常、動き推定では、有望な探索開始位置と、その周辺について符号化コスト計算を行い、その中で一番良い候補を選択する。この際、符号化コストの計算は、10回から1000回は行われる。本発明の場合、予測方向の選択に不必要的動き推定処理を途中で打ち切ることができ、フルペル予測の処理量を削減するこ  
10 とが可能となる。

ここで、メモリ26の割り当て量を、1枚の参照ピクチャを格納する場合と同じにするため、画素情報の間引かれた2枚の参照ピクチャを用いて、動き推定することとしても良い。

また、小ブロックフルペル予測ステップS45と予測方向選択ステップS46  
15 とは、それぞれの小ブロックごとに並列処理されるだけでなく、全ての小ブロックについて並列処理されるものであっても良い。

図7を用いて、 $16 \times 16$ の画像ブロックを4種類の分割方法で分割した場合の全ての小ブロックSb1～Sb9に対する、小ブロックフルペル予測ステップS45と予測方向選択ステップS46との処理順序について説明する。

図7では、全ての小ブロックSb1～Sb9に対する、小ブロックフルペル予測ステップS45と予測方向選択ステップS46とが並列実行されている。また、図6(b)を用いて説明したように、それぞれの小ブロックごとに、不必要的予測方向への動き推定の処理が打ち切られる。さらに、小ブロックごとの符号化コストの比較により、符号化コストが小さくならない小ブロックについての動き  
20 推定の処理が打ち切られる。

すなわち、小ブロックごとに、不要な予測方向への動き推定処理を打ち切るだけでなく、分割方法の選択に不要な小ブロックへの動き推定処理も打ち切ることが可能となる。これにより、不必要的動き推定処理をさらに削減することが可能となり、フルペル予測の処理量をさらに削減することが可能となる。

## (1-3)

上記実施形態において、小ブロックフルペル予測ステップS45と予測方向選択ステップS46とは、小ブロックごとに逐次処理されるものであってもよい。

図8を用いて、 $16 \times 16$ の画像ブロックを2つに分割した $16 \times 8$ の小ブロックSb2, Sb3(図25参照)に対する小ブロックフルペル予測ステップS45と予測方向選択ステップS46との処理順序について説明する。

小ブロックフルペル予測ステップS45と予測方向選択ステップS46とが逐次処理される場合(図8(a)参照)、前方向予測ステップS452、後方向予測ステップS456、および小ブロックごとの予測方法選択ステップS46である小ブロック予測方法選択ステップS463は、以下の順番で行われる。小ブロックSb2についての前方向予測ステップS452'、小ブロックSb2についての後方向予測ステップS456'、小ブロックSb3についての前方向予測ステップS452"、小ブロックSb3についての後方向予測ステップS456"、小ブロックSb2についての予測方法選択ステップS46である小ブロック予測方法選択ステップS462'、小ブロックSb3についての小ブロック予測方法選択ステップS462"の順である。

一方、小ブロックフルペル予測ステップS45と予測方向選択ステップS46とが、小ブロックごとに逐次処理される場合には(図8(b)参照)、まず、小ブロックSb2についての処理が行われ、その後、小ブロックSb3についての処理が行われる。すなわち、まず、小ブロックSb2についての前方向予測ステップS452'、後方向予測ステップS456'、小ブロック予測方法選択ステップS462'が行われる。その後、小ブロックSb3についての前方向予測ステップS452"、後方向予測ステップS456"、小ブロック予測方法選択ステップS462"が行われる。また、この際に、小ブロックごとの処理は、(1-2)で説明したように、並列処理されてもよい。例えば、小ブロック1についての前方向予測ステップS452"、後方向予測ステップS456"、小ブロック予測方法選択ステップS462"が並列実行されても良い。

## (1-4)

図9及び図10を用いてフルペル予測部13の変形例について説明する。図9

は、画像ブロックについての符号化モード決定の処理フローを示すブロック図である。図9の画像ブロックについての符号化モード決定の処理フローは、フルペル予測部13により実行されるフルペル予測ステップS41' と、分割方法候補選択部14により実行される分割方法候補選択ステップS42' とを備えている

5 。

フルペル予測ステップS41' は、小ブロックフルペル予測ステップS45と、符号化コスト換算ステップS66とを備えている。

小ブロックフルペル予測ステップS45は、 $16 \times 16$ の画像ブロックを4種類の分割方法候補により分割した $M \times N$  ( $(M, N) = (16, 16), (16, 8), (8, 16), (8, 8)$ ) の小ブロックSb1～Sb9 (図25参照) のそれぞれに対して、整数画素精度の動き推定を行い、小ブロック毎の符号化コストおよび動きベクトルを導出する。具体的には、それぞれの小ブロックSb1～Sb9に対して、前方向予測ステップS451～ステップS454および後方向予測ステップS455～ステップS458が行われている。すなわち、前方向予測ステップS451～ステップS454および後方向予測ステップS455～ステップS458では、それぞれの分割方法候補により分割された小ブロックの個数に応じた回数の処理が行われている。図9では、この回数を処理ブロックからの矢印の本数で表している。

符号化コスト換算ステップS66は、前方向予測ステップS451～ステップS454の符号化コストと後方向予測ステップS455～ステップS458の符号化コストを、それぞれ個別に、画像ブロック単位に換算する。具体的には、画像ブロック単位に換算した換算値とは、小ブロックフルペル予測ステップS45によって得られた各小ブロックの各予測符号の符号化コストに、当該パーティションの分割数を乗じた値である。

分割方法候補選択ステップS42' は、符号化コスト導出ステップS47が導出した画像ブロック単位での符号化コストを比較し、符号化コストが小さい2種類の分割方法候補を選択する。

図10を用いて、フルペル予測ステップS41' と分割方法候補選択ステップS42' との処理について詳しい説明を加える。なお、上述の様に、フルペル予

測ステップS 4 1' は、小ブロックフルペル予測ステップS 4 5と、符号化コスト換算ステップS 6 6とを備えている。

小ブロックフルペル予測ステップS 4 5は、小ブロックS b 1～S b 9の全てに対して、整数画素精度の前方向予測（図10では、fwと記載）と後方向予測（図10では、bwと記載）と双方向予測（図10では、bid）を行い、それぞれの参照方向に対する符号化コストを導出する。図10では、それぞれの符号化コストを例示している。例えば、小ブロックS b 1では、前方向予測の符号化コストが（40）、後方向予測の符号化コストが（70）である。

符号化コスト換算ステップS 6 6は、前方向予測ステップS 4 5 1～ステップS 4 5 4の符号化コストと後方向予測ステップS 4 5 5～ステップS 4 5 8の符号化コストとを、それぞれ個別に、画像ブロック単位の符号化コストに換算する。具体的には、S b 1のfw、bw、bidの符号化コストは1倍し、S b 2～S b 5のfw、bw、bidの符号化コストは2倍し、S b 6～S b 9のFW、bw、bidの符号化コストは4倍する。

上記実施形態では、図11（a）に示すように、フルペル予測ステップS 4 1' を実行するフルペル予測部13は、それぞれの小ブロックS b 1～S b 9に対して、前方向予測ステップS 4 5 1～S 4 5 4および後方向予測ステップS 4 5 5～S 4 5 8のみを実行すると説明した（以下、第1フルペル予測方法という）。ここで、フルペル予測ステップS 4 1' は、さらに双方向予測を実行し符号化コストを導出するものであっても良い（以下、第2フルペル予測方法という）。また、前方向予測ステップS 4 5 1～S 4 5 4および後方向予測ステップS 4 5 5～S 4 5 8により導出された符号化コストから双方向予測を実行した場合の符号化コストを推定するものであっても良い（以下、第3フルペル予測方法という）。

分割方法候補選択ステップS 4 2' では、フルペル予測ステップS 4 1' により導出された画像ブロック単位での符号化コストを比較し、符号化コストが小さい2種類の分割方法候補を選択する。図10では、16×16の分割方法のfw（符号化コスト（40））および16×16の分割方法のbw（符号化コスト（70））が分割方法候補として選択される。

〈エンコーダ1の効果〉

エンコーダ1では、分割方法候補選択ステップS42'において、フルペル予測ステップS41'が導出した画像ブロック単位での符号化コストを比較し、符号化コストが小さい2種類の分割方法候補を選択しているため、全ての小ブロック

5 クSb1～Sb9についてサブペル予測を行う必要が無い。このため、サブペル予測の回数を削減でき、処理量を低減することが可能となる。また、必要な小ブロックにはサブペル予測を行うため、符号化効率を維持することが可能となる。

特に、この実施形態では、前記実施形態とは異なり、分割方法候補選択ステップS42'までに各分割方法の予測方向が絞り込まれておらず、すなわち各分割方法の各予測方向ごとにそれぞれ符号化コストが分割方法候補選択ステップS42'での比較の対象となっている。言い換えると、フルペル予測部13が小ブロックのピクチャ参照方向ごとの符号化コストを画像ブロック単位に換算して符号化モードを導出するため、一つの小ブロックにおいて異なるピクチャ参照方向の符号化モードも分割方法候補選択ステップS42での比較対象となる。そのため、図10に示す実施形態の画像ブロック場合は、最小の符号化コストである16×16の分割方法のfw(符号化コスト(40))および16×16の分割方法のbw(符号化コスト(70))が2種類の分割方法候補として選択される。この実施形態の画像ブロックに対して前記実施形態の装置を適用した場合は、フルペル予測ステップS41において16×16の分割方法についてはbwが放棄さ

20 れるため、例えば第2候補として16×8分割(sb2がbidで、sb3がbidであり、符号化コストが77)が選択されてしまう。

なお、図11(b)に示すように、符号化コスト換算ステップS66を小ブロックフルペル予測ステップS45内で行ってもよい。例えば、符号化換算処理は2倍や4倍といった簡単な計算であるため、小ブロックフルペル予測ステップS45内にマージしてもよい。また、換算値は、小ブロックフルペル予測ステップS45中に1探索位置ごとに算出してもよいし、小ブロックフルペル予測ステップS45後に求めてよい。

(2) 分割方法候補選択部14の変形例

分割方法候補選択ステップS42が選択する分割方法候補は、2種類に限られない。4種類の分割方法候補のうち、1～3種類の分割方法候補を選択するものであれば良い。

(3) サブペル予測部15の変形例

5 (3-1)

上記実施形態では、サブペル予測ステップS43は、分割方法候補選択ステップS42において選択された2種類の分割方法候補により分割された小ブロックのそれぞれについて、前方向予測、後方向予測、および双方向予測の3種類の予測方向へのサブペル予測を行うと説明した。

10 ここで、サブペル予測ステップS43は、フルペル予測ステップS41の動き推定の結果に基づいて、各分割候補において3種類の予測方向のうち実際に行うものを決定し、決定したものについてのみサブペル予測を行っても良い。これについて、図12を用いて説明する。

15 まず、フルペル予測ステップS41は、それぞれのパーティションに対する前方向および後方向の整数画素精度の動き推定を行う。分割方法候補選択ステップS42は、フルペル予測ステップS41の整数画素精度の動き推定に基づいて、分割方法候補を選択する。さらに、サブペル予測ステップS43は、分割方法候補選択ステップS42で選択された分割方法候補により分割された小ブロックについてのサブペル予測の予測方向を判断する。

20 より具体的には、以下の3つのケースにより予測方向が判断される。

第1のケースは、前方向予測の符号化コストと後方向予測の符号化コストとがほぼ一致する場合である。この場合、前方向予測、後方向予測、および双方向予測の3種類の予測方向について、非整数画素精度の動き推定が実行される。また、この場合に、前方向予測および後方向予測の2種類の予測方向についてのみ、非整数画素精度の動き推定が実行されてもよい。

第2のケースは、第1のケース以外で、前方向予測の符号化コストが後方向予測の符号化コストよりも小さい場合である。この場合、前方向予測による非整数画素精度の動き推定が実行され、後方向予測および双方向予測による非整数画素精度の動き推定は実行されない。

第3のケースは、第1のケース以外で、前方向予測の符号化コストが後方向予測の符号化コストよりも大きい場合である。この場合、後方向予測による非整数画素精度の動き推定が実行され、前方向予測および双方向予測による非整数画素精度の動き推定は実行されない。

5 第2及び第3のケースのように前方向予測と後向予測の符号化コストが異なる場合は符号化コストが小さい方のみを選択するのは、一方の符号化コストが大きい場合は双方向予測で符号化コストが小さくなることが期待できないからである。

10 以上に述べたように、上記3つのケースの判断により、必要な参照方向を参照して非整数画素精度の動き推定を実行することが可能であるため、サブペル予測の処理量を削減でき、サブペル予測の処理時間を短縮可能となる。

### (3-2)

上記(3-1)の判断に加えて、サブペル予測ステップS43は、分割方法候補選択ステップS42において選択された分割方法候補のうちのさらに一部の分割方法候補に対してサブペル予測を行うものであってもよい。すなわち、この場合、分割方法候補選択ステップS42において選択された分割方法候補でもサブペル予測が行われないものが発生する。つまり、複数の符号化モードから選択された一部の符号化モードの全部についてサブペル予測を行う必要がなく、処理量を削減できる。また、処理量を一定に保つように一部の符号化モードのうちの少なくとも一部の符号化モードを選択することも可能となる。

20 例えば、上記(3-1)で判断された予測方向に基づいて、サブペル予測の対象となる小ブロックごとの必要処理量が推定される。さらに、画像ブロック全体についての必要処理量の合計が、画像ブロックのサブペル予測に割り当てられた処理余裕量を超えないように、サブペル予測を行う小ブロックの候補を絞り込む。このため、サブペル予測ステップS43は分割方法候補選択ステップS42によって選択された符号化モード(具体的には、分割方法候補)の全てを選択しないこともあり得るが、その場合でも符号化コストが低い分割方法候補は選択されているため問題が少ない。

より具体的には、図13のサブペル予測の動作処理フローを用いて説明する。なお、説明の都合上、16×16の小ブロックSb1の1予測方向あたりの必要

処理量を [4]、 $16 \times 8$ 、 $8 \times 16$  の小ブロック Sb2～Sb5 の必要処理量をそれぞれ [2]、 $8 \times 8$  の小ブロック Sb6～Sb9 の必要処理量をそれぞれ [1] として説明を行う。小ブロックの 1 予測方向あたりのサブペル予測の必要処理量は、小ブロックの画素数に比例するためである。

5 処理は、画像ブロック単位で行われる（ステップ S30～ステップ S37）。まず、 $16 \times 16$  の画像ブロックのサブペル予測に割り当てられた処理量が処理余裕量として設定される（ステップ S30）。次に、分割方法候補毎の処理が行われる（ステップ S31～ステップ S37）。

10 分割方法候補毎の処理は、分割方法候補選択ステップ S42において選択された分割方法候補のうち、フルペル予測による符号化コストが小さいものから順番に行われる。まず、（3-1）で説明した方法により、小ブロックごとのサブペル予測の予測方向が選択され、小ブロックごとのサブペル予測の必要処理量が推定される。さらに、推定された小ブロックごとの必要処理量は、分割方法候補単位で合計され、分割方法候補全体の必要処理量が算出される（ステップ S31）。

15 例えば、 $16 \times 8$  の小ブロック Sb2 に対して、1 方向の予測方向が選択された場合には（例えば、（3-1）の第 2 のケースまたは第 3 のケース）、小ブロック Sb2 の 1 予測方向あたりの必要処理量 [2] に、予測方向から定まる定数 [1] を乗じた値 [2] が小ブロック Sb2 の必要処理量として算出される。また、3 方向の予測方向が選択された場合には（例えば、（3-1）の第 1 のケース）、小ブロック Sb2 の 1 予測方向あたりの必要処理量 [2] に、予測方向から定まる定数 [2] を乗じた値 [4] が小ブロック Sb2 の必要処理量として算出される。ここで、3 方向の予測方向が選択されている場合に予測方向から定まる定数を [2] としている理由は、双方向予測については、動き推定処理は行わず、前方向予測および後方向予測の結果を利用した予測を行うことができるからである（図 5（b）又は（c）で説明した方法をサブペル予測に利用可能である。）。このようにして推定した小ブロック毎の必要処理量は、分割方法単位で合計され、分割方法候補の必要処理量が算出される。

算出された必要処理量は、ステップ S30 で設定された処理余裕量と比較され、必要処理量が処理余裕量より大きくなっている場合には、処理余裕があると判定される

(ステップS32)。

処理余裕があると判定された場合には、(3-1)で選択された予測方向に対する小ブロックごとのサブペル予測が行われる(ステップS33)。さらに、処理余裕量と分割方法候補の必要処理量との差が処理余裕量として設定され、次の

5 分割方法候補に対する処理が開始される。

処理余裕が無いと判定された場合には、フルペル予測に基づいて最小の符号化コストを示すと判断される1つの予測方向が小ブロック毎に選択され(ステップS55)、小ブロックごとの必要処理量が分割方法候補単位で合計され、分割方法候補の必要処理量が算出される(ステップS35)。例えば、 $16 \times 8$ の小ブ

10 ロックSb2, Sb3に対して、小ブロックSb2, Sb3の1予測方向あたりの必要処理量[2]が合計され、 $16 \times 8$ の分割方法候補の必要処理量が[4]と算出される。算出された必要処理量は、ステップS30で設定された処理余裕量と比較され、必要処理量が処理余裕量より小さい場合には、処理余裕があると判定される(ステップS36)。

15 処理余裕があると判定された場合には、フルペル予測に基づいて最小の符号化コストを示すと判断される1つの予測方向に対するサブペル予測が行われる(ステップS37)。さらに、処理余裕量とステップS35で算出された分割方法候補の必要処理量との差が処理余裕量として設定され(ステップ34)、次の分割方法候補に対する処理が開始される。

20 ステップS36で処理余裕がないと判定された場合には、サブペル予測は行わず、次の画像ブロックの処理を開始する。

(3-2-1)

次に、図14を用いて、第1の具体例を説明する。この具体例では、分割方法候補選択ステップ42において、第1候補として $16 \times 16$ 分割方法(符号化コスト(40))が選択され、第2候補として $16 \times 8$ 分割方法(符号化コスト(43))が選択されている。

図14に示すように、処理は、画像ブロック単位で行われる(ステップS30～ステップS37)。まず、 $16 \times 16$ の画像ブロックのサブペル予測に割り当てられた処理量が処理余裕量[8]として設定される(ステップS30)。次に、

分割方法候補毎の処理が行われる（ステップS31～S37）。

分割方法候補毎の処理は、分割方法候補選択ステップS42において選択された分割方法候補のうち、フルペル予測による符号化コストが小さいものから順番に行われる。

5 最初は、 $16 \times 16$  の分割方法（符号化コスト（40））が対象になる。具体的には、 $16 \times 16$  の分割方法において、まず、（3-1）で説明した方法により、小ブロックSb1のサブペル予測の予測方向が選択される。この場合は、第2のケースであり、前方向予測fwの符号化コストが後方向予測bwの符号化コストよりも小さい場合である。そのため、前方向予測による非整数画素精度の動き推定が実行され、後方向予測および双方向予測による非整数画素精度の動き推定は実行されない。この結果、小ブロックSb1のサブペル予測の必要処理量[4]が推定される。さらに、 $16 \times 16$  の分割方法の必要処理量[4]が算出される（ステップS31）。

15 算出された必要処理量[4]は、ステップS50で設定された処理余裕量[8]と比較され、必要処理量[4]が処理余裕量[8]より大きくないため、処理余裕があると判定される（ステップS32）。

この場合は、（3-1）で選択された予測方向（fw）に対する小ブロックSb1のサブペル予測が行われる（ステップS33）。さらに、処理余裕量[8]と分割方法候補の必要処理量[4]との差が処理余裕量[4]として設定される（ステップS34）。

次に、 $16 \times 8$  の分割方法（符号化コスト（42））が対象になる。具体的には、 $16 \times 8$  の分割方法において、まず、（3-1）で説明した方法により、第2のケースとして小ブロックSb2のサブペル予測の予測方向が選択され（fw）、小ブロックSb2のサブペル予測の必要処理量[2]が推定される。また、25 第3のケースとして小ブロックSb3のサブペル予測の予測方向が選択され（bw）、小ブロックSb3のサブペル予測の必要処理量[2]が推定される。さらに、推定された小ブロックSb2の必要処理量[2]と小ブロックSb3の必要処理量[2]は合計され、 $16 \times 8$  の分割方法候補の必要処理量[4]が算出される（ステップS31）。

算出された必要処理量 [4] は、ステップ S 3 4 で設定された処理余裕量 [4] と比較され、必要処理量 [4] が処理余裕量 [4] より大きくないため、処理余裕があると判定される（ステップ S 3 2）。

この場合は、（3-1）で選択された予測方向（f w）に対する小ブロック S 5 b 2 のサブペル予測が行われ、さらに（3-1）で選択された予測方向（b w）に対する小ブロック S b 3 のサブペル予測が行われる（ステップ S 3 3）。

さらに、処理余裕量 [4] とステップ 3 5 で算出された分割方法候補の必要処理量 [4] との差が処理余裕量として設定されるが（ステップ S 3 4）、その値が [0] になったので、次の分割方法候補に対する処理は行わない。

10 (3-2-2)

次に、図 15 を用いて、第 2 の具体例を説明する。この具体例では、分割方法候補選択ステップ 4 2 において、第 1 候補として  $16 \times 16$  分割方法（符号化コスト（40））が選択され、第 2 候補として  $16 \times 8$  分割方法（符号化コスト（43））が選択されている。

15 図 15 に示すように、処理は、画像ブロック単位で行われる（ステップ S 3 0 ～ S 3 7）。まず、 $16 \times 16$  の画像ブロックのサブペル予測に割り当てられた処理量が処理余裕量 [8] として設定される（ステップ S 3 0）。次に、分割方法候補毎の処理が行われる（ステップ S 3 1 ～ ステップ S 3 7）。

分割方法候補毎の処理は、分割方法候補選択ステップ S 4 2 において選択された分割方法候補のうち、フルペル予測による符号化コストが小さいものから順番に行われる。

最初は、 $16 \times 16$  の分割方法（符号化コスト（40））が対象になる。具体的には、 $16 \times 16$  の分割方法において、まず、（3-1）で説明した方法により、小ブロック S b 1 のサブペル予測の予測方向が選択される。第 1 のケースであり、前方向予測 f w の符号化コストと後方向予測の符号化 b w コストとがほぼ一致している。そのため、前方向予測 f w および後方向予測 b w の 2 種類の予測方向について、非整数画素精度の動き推定が実行される。その結果、小ブロック S b 1 の前方向予測 f w のサブペル予測の必要処理量 [4] と、小ブロック S b 1 の前方向予測 b w のサブペル予測の必要処理量 [4] とが推定される。推定さ

れた小ブロック  $S_{b1}$  ごとの必要処理量 [4] は、分割方法候補単位で合計され、分割方法候補の必要処理量 [8] が算出される（ステップ S 3 1）。

算出された必要処理量 [8] は、ステップ S 3 0 で設定された処理余裕量 [8] と比較され、必要処理量 [8] が処理余裕量 [8] より大きくないため、  
5 処理余裕があると判定される（ステップ S 3 2）。

この場合は、（3-1）で選択された予測方向（fw）に対する小ブロック  $S_{b1}$  のサブペル予測が行われ、さらに予測方向（bw）に対する小ブロック  $S_{b1}$  のサブペル予測が行われる（ステップ S 3 3）。

さらに、処理余裕量 [8] とステップ 5 5 で算出された分割方法候補の必要処理量 [8] との差が処理余裕量として設定されるが（ステップ S 3 4）、その値が [0] になったので、次の分割方法候補に対する処理は行わない。

この具体例では、 $16 \times 8$  分割方法（符号化コスト（4 2））は、分割方法候補選択ステップ S 4 2 において選択された分割方法候補であるにもかかわらず、サブペル予測が行われない。

### 15 (3-2) の効果

このサブペル予測部 1 5 では、サブペル予測の処理量を制御することが可能となる。特に、処理量を最小にする制御を行うと、ソフトウェアエンコーダの場合には、処理時間の短縮化の効果があり、ハードウェアエンコーダの場合には、消費電力削減の効果がある。また、リアルタイムエンコーダのように、処理時間を一定にしなければならない場合には、余裕分の処理量を他の候補に配分することで、圧縮性能を上げることも可能となる。

### (3-3)

上記実施形態では、以下のように説明した。すなわち、分割方法決定ステップ S 4 4 は、分割方法候補選択ステップ S 4 2 において選択された 2 種類の分割方法候補により分割されたそれぞれの小ブロックについて最小となる符号化コストから、小ブロックごとの予測方向を決定するとともに、画像ブロック単位での符号化コストを導出する。さらに、導出された画像ブロック単位での符号化コストを 2 種類の分割方法候補について比較し、最小の符号化コストを有する分割方法候補を画像ブロックの分割方法として決定する。

ここで、分割方法候補選択ステップS42が選択する分割方法候補は、2種類に限られず、さらに多くの候補を選択してもよい。

また、分割方法決定ステップS44は、画像ブロックの分割方法を1つに決定せず、さらに多くの方法を選択するものであってもよい。例えば、分割方法決定5ステップS44では、2つの符号化モードを選択し、さらに別のステップによって最終的な符号化モードを決定してもよい。

#### (4) その他の変形例

##### (4-1)

フルペル予測部13では整数画素精度の動き推定が、サブペル予測部15では10非整数画素の動き推定が行われると記載した。ここで、動き推定の精度は、これらに限定されるものではない。

例えば、フルペル予測部13では、簡易な動き推定が、サブペル予測部15では、複雑な動き推定が行われるものであってもよい。

より具体的には、複雑な動き推定とは、簡易な動き推定よりも複雑な動き推定15のことであり、例えば、複雑な動き推定とは、整数画素精度の簡易な動き推定に対するより詳細な精度（例えば、1/2画素精度、1/4画素精度などといった非整数画素精度）での動き推定、非整数画素の簡易な動き推定に対するより詳細な精度での動き推定、縮小画像（画素情報の間引かれた画像）を参照する簡易な動き推定に対するより詳細な画像を参照する動き推定などである。

さらに、簡易な動き推定は、縮小画像に対して2画素精度、1/2画素精度などの動き推定であってもよい。

これにより、複雑な動き推定の処理量を低減しつつ、複雑な動き推定による適切な動き推定の効果を享受することが可能となる。

また、ここでは2段階の精度の動き推定により符号化モードの選択を行っているが、より多くの段階により選択を行ってもよい。

例えば、整数画素精度、1/2画素精度、1/4画素精度というように、3段階の精度の動き推定を用いて、符号化モードの選択を行ってもよい。

##### (4-2)

フルペル予測部 13 あるいはサブペル予測部 15 は、それぞれの動き推定の処理量がほぼ一定に保たれるように動き推定の方式を変化させるものであってよい。

従来では、それぞれの動き推定処理に際して、それぞれ所定の処理時間が割り当てられており、この所定の処理時間内で、固定的に選択されたパーティションサイズ、参照ピクチャに対して動き推定処理が行われている。この場合、処理量が最も多くなると考えられる場合（ワーストケース）を想定して処理時間が割り当てられるため、処理対象がワーストケースで無い場合、処理時間に余裕が生まれ、効率的な動き推定処理が妨げられている。

そこで本発明では、処理に余裕がある場合には、動き推定の方式を変化させ、効率的な動き推定処理を行う。ここで、処理に余裕があるか否かは、例えば、画像ブロックにより構成される入力画像の画像属性に応じて、判断される。画像属性とは、例えば、画像のサイズや、画像の符号化方式（ピクチャタイプ〔I ピクチャ、P ピクチャ、B ピクチャ〕など）や、画像のフォーマット（走査方式〔プログレッシブ、インターレース〕、色差フォーマットなど）や、画像の動き量などである。

#### （4－2－1）

例えば、画像ブロックにより構成される入力画像サイズと参照ピクチャ数とパーティションサイズ数との積がほぼ一定になるように、動き推定の方式（参照するピクチャの枚数・方向、動き推定を行うパーティションサイズのバリエーション、動きの探索範囲など）を変化させる。より具体的には、入力画像サイズが小さい場合には、参照ピクチャ数やパーティションサイズ数を大きくし、フルペル予測あるいはサブペル予測の処理をより精度良く行うことが可能となる。

#### （4－2－2）

また、例えば、B ピクチャの参照ピクチャ数を P ピクチャよりも少なくし、ピクチャ単位で動き推定の処理量がほぼ一定に保たれるようにする。より具体的には、次のようなバリエーションが考えられる。<1> P ピクチャでは前方 4 枚を参照し、B ピクチャでは前方 2 枚・後方 2 枚を参照する。<2> P ピクチャでは前方 3 枚を参照し、B ピクチャでは前方 2 枚・後方 1 枚を参照する。<3> P ピ

クチャでは前方2枚を参照し、Bピクチャでは前方1枚・後方1枚を参照する。

(4-2-3)

また、例えば、Bピクチャのパーティションサイズ数をPピクチャよりも少なくし、ピクチャ単位での動き推定の処理量がほぼ一定に保たれる用にする。より5具体的には、次のようなバリエーションが考えられる。<1>Pピクチャでは前方1枚を参照し、 $16 \times 16$ ,  $16 \times 8$ ,  $8 \times 16$ ,  $8 \times 8$ の4パーティションサイズで予測を行うとする。一方、Bピクチャでは、上記4サイズのいずれか二つを選び、それぞれが前方予測と後方予測を行うとする。<2>Pピクチャでは後方1枚を参照し、 $16 \times 16$ ,  $16 \times 8$ ,  $8 \times 16$ ,  $8 \times 8$ の4パーティションサイズで予測を行うとする。一方、Bピクチャでは、上記4サイズのいずれか10二つを選び、それぞれが前方予測と後方予測を行うとする。

(4-2-4)

また、例えば、入力画像がインターレースの場合には参照ピクチャ数あるいはパーティションサイズ数をプログレッシブの場合よりもより減らす。これは、15インターレースの場合には、トップフィールドとボトムフィールドの二フィールドを参照する必要があるからである。より具体的には、次のようなバリエーションが考えられる。<1>Pピクチャの場合、プログレッシブのPピクチャでは、前方2フレームを参照し、インターレースのPピクチャでは、前方2フィールド(時間的には1フレーム分)を参照する。<2>Pピクチャの場合、プログレッ20シブのPピクチャでは、前方1フレームを参照し、パーティションサイズは4種類( $16 \times 16$ から $8 \times 8$ )の予測をし、インターレースのPピクチャでは、前方2フィールド(時間的には1フレーム分)を参照し、パーティションサイズはそれぞれ2種類の予測をする。

(4-2-5)

25 また、例えば、画像の動きに応じて、参照ピクチャ数あるいはパーティションサイズ数を変化させる。動きベクトルの探索では、探索の処理時間が動きベクトルの大きさの影響を受ける方式がある。このような方式を用いた場合、動きが小さければ、各パーティションサイズ・各参照ピクチャの処理時間が短い。このため、動きが小さい場合には、より多くのパーティションサイズ数・参照ピクチャ

数を用いて動き推定を行う。一方、動きが大きい場合には、それぞれの動き推定の処理時間が長くなる。このため、動きが大きい場合には、参照ピクチャの枚数を減らす、あるいは、パーティションサイズ数を減らす。

### [第2実施形態]

5 図16及び図17を用いて、本発明の第2実施形態としてのエンコーダについて説明する。

図16は、本発明の第2実施形態としてのエンコーダ60の構造を説明するブロック図である。エンコーダ60は、例えば、入力画像信号30をMPEG-4符号化し、符号化画像信号31として出力する画像符号化装置であり、パソコン10 ルコンピュータ(PC)、携帯電話などにおいて備えられる。また、AVCにおいて導入された画像ブロックペア73という単位で入力画像信号30を符号化する装置である(図30参照)。

#### 〈エンコーダ60の構成〉

図16に示すエンコーダ60は、入力画像信号30のイントラ予測を行うイントラ予測部61と、入力画像信号30のインター予測を行なうインター予測部62と、符号化モード決定部63と、イントラ予測およびインター予測の予測結果を切り換える切換部64と、切換部64の出力を符号化して符号化画像信号31を出力する符号化部5と、入力画像信号30のローカルデコード信号32を作成する参照画像作成部6とを備えている。

20 イントラ予測部61は、図示しない制御部により制御され、符号化ピクチャ構造決定部67が決定したピクチャ構造のブロック(フィールド構造ブロックまたはフレーム構造ブロック)についてイントラ予測を行う。その結果、イントラ予測部61は、入力画像信号30を画像ブロック毎にイントラ予測し、イントラ予測結果を切換部4に出力する。

25 インター予測部62は、入力画像信号30を第1の入力とし、ローカルデコード信号32を第2の入力として、インター予測結果を切換部4に出力する。さらに、インター予測部62は、インター予測結果のうち、動きベクトルなど符号化にかかる情報を第2の出力として符号化部5に出力する。

インター予測部3は、入力画像信号30を第1の入力、ローカルデコード信号

3 2 を第 2 の入力とし、動き推定を行う動き推定部 6 5 と、動き推定部 6 5 の出力を第 1 の入力、ローカルデコード信号 3 2 を第 2 の入力とし、予測画像を出力する予測画像作成部 1 1 と、入力画像信号 3 0 を第 1 の入力、予測画像作成部 1 1 の出力を第 2 の入力とする減算部 1 2 とから構成されている。動き推定部 6 5  
5 は、動き推定を行い、符号化コスト導出する。また、動き推定部 6 5 の出力のうち、動きベクトルや符号化モードなどの符号化情報は、可変長符号化部 2 2 の入力にも与えられる。

切換部 4 は、イントラ予測結果を第 1 の入力、インター予測結果を第 2 の入力とし、符号化モード決定部 6 3 からの切換信号に従って、いずれかの入力を符号  
10 化部 5 に出力する。

符号化部 5 及び参照画像作成部 6 の構造及び機能は前記実施形態と同様であるため、ここでは説明を省略する。

符号化モード決定部 6 3 は、符号化ピクチャ構造決定部 6 7 と、イントラ／インター決定部 6 8 とを有している。符号化ピクチャ構造決定部 6 7 は、動き推定部 6 5 からの符号化コスト情報を入力としている。符号化ピクチャ構造決定部 6 7 は、トップ・ボトムについての符号化コストを、符号化ピクチャ構造毎に合計し、符号化ピクチャ構造を決定する。符号化ピクチャ構造決定部 6 7 は、決定した符号化ピクチャ構造をイントラ／インター選択部 6 8 に出力する。

イントラ／インター選択部 6 8 は、イントラ予測部 6 1 からのイントラ予測の符号化コストと、インター予測部 6 2 からのインター予測の符号化コストを入力としている。イントラ／インター選択部 6 8 は、イントラ予測とインター予測の符号化コストを比較し、符号化モードを決定する。イントラ／インター選択部 6 8 は、この結果を切換部 6 4 に通知する。この結果、切換部 6 4 が動作する。

なお、制御部は、符号化モード決定部 6 3 が備えていても良い。

25 図 1 7 は、符号化モード決定（画像ブロックペアについての符号化ピクチャ構造決定と符号化予測方式決定）の処理フローを示すブロック図である。図 1 7 の処理フローは、動き推定部 6 5 によるインター予測ステップ S 5 1 と、符号化ピクチャ構造決定部 6 7 による符号化ピクチャ構造決定ステップ S 5 2 と、イントラ予測部 6 1 によるイントラ予測ステップ S 5 3 と、イントラ／インター選択部

6 8 による符号化予測方式決定ステップS 5 4 とを備えている。

インター予測ステップS 5 1 は、画像ブロックペア7 3 のフィールド構造ブロックペア7 5, 7 6 およびフレーム構造ブロックペア7 7, 7 8 についての動き推定結果を導出する（図3 0 参照）。具体的には、インター予測ステップS 5 1 5 は、フレーム構造トップMB 7 7 についての第1インター予測ステップS 5 1 1 とボトムMB 7 8 についての第2インター予測ステップS 5 1 2 とを備えている。第1インター予測ステップS 5 1 1 は、フレーム構造トップMB 7 7 に対してインター予測を行い、符号化コスト（cost top0）を導出する。第2インター予測ステップS 5 1 2 は、フレーム構造ブロックペアのボトムMB 7 8 に対してインター予測を行い、符号化コスト（cost bot0）を導出する。各符号化コストcost top0, cost bot0は符号化ピクチャ構造決定ステップS 5 2 に送られる。さらに各符号化コストcost top0, cost bot0が合計され、フレーム構造ブロックペア7 7, 7 8 の符号化コストcost0が得られ、それが符号化ピクチャ構造決定ステップS 5 2 に送られる。なお、この実施形態では、cost top0は1 5 0 0 であり、cost bot0は1 3 0 0 であり、cost0は2 8 0 0 である。インター予測ステップS 5 1 15 は、フィールド構造ブロックペア7 5, 7 6 のトップMB 7 5 についての第3インター予測ステップS 5 1 3 と、ボトムMB 7 6 についての第4インター予測ステップS 5 1 4 とをさらに備えている。第3インター予測ステップS 5 1 3 は、フィールド構造ブロックペア7 5, 7 6 のトップMB 7 5 に対してインター予測を行い、符号化コスト（cost top1）を導出する。第4インター予測ステップS 5 1 4 20 は、フィールド構造ブロックペア7 5, 7 6 のボトムMB 7 6 に対してインター予測を行い、符号化コスト（cost bot1）を導出する。各符号化コストcost top1, cost bot1は符号化ピクチャ構造決定ステップS 5 2 に送られる。さらに各符号化コストcost top1, cost bot1が合計され、フィールド構造ブロ25 ックペア7 5, 7 6 の符号化コストcost1が得られ、それが符号化ピクチャ構造決定ステップS 5 2 に送られる。なお、この実施形態では、cost top1は1 4 0 0 であり、cost bot1は1 3 0 0 であり、cost1は2 7 0 0 である。

なお、第1～第4インター予測ステップS 5 1 1 ～ステップS 5 1 4 は、それぞれが、1 6 × 1 6 の分割方法、1 6 × 8 の分割方法、8 × 1 6 の分割方法、8

× 8 の分割方法を含んだ動き推定動作全体を表している。つまり、第 1 ～ 第 4 インター予測ステップ S 511 ～ S 514 には、本発明の第 1 実施形態を適用できる。また、第 1 ～ 第 4 インター予測ステップ S 511 ～ ステップ S 514 は、フルペル予測とサブペル予測の両方を行っても良いが、処理量削減のためフルペル  
5 予測だけを行っても良い。

以上のように符号化ピクチャ構造の符号化コスト導出にはインター予測のみを行っているが、インター予測の判定の精度はイントラ予測より良いため、十分な精度が得られる。

符号化ピクチャ構造決定ステップ S 52 は、動き推定結果に基づいて、画像ブ  
10 ロックペア 73 の符号化ピクチャ構造を決定する。具体的には、符号化ピクチャ構造決定ステップ S 52 は、インター予測ステップ S 51 からのフレーム構造ブロックペア 77, 78 の符号化コスト cost0 と、フィールド構造ブロックペア 75, 76 の符号化コスト cost1 とを比較し、フレーム／フィールド選択を行う。この実施形態ではフィールド構造ブロックペア 75, 76 の符号化コスト cost1(2700) がフレーム構造ブロックペア 77, 78 の符号化コスト cost0(2800) より小さいため、フィールドを選択する。この結果、フィールド構造ブロックペア 75, 76 のトップ MB 75 のインター符号化コスト cost\_top1 とボトム MB 76 のインター符号化コスト cost\_bot1 が、符号化予測方式決定ステップ S 54 に提供される。  
20 イントラ予測ステップ S 53 は、決定された符号化ピクチャ構造を有するブロックペアについてのイントラ予測結果を導出する。具体的には、イントラ予測ステップ S 53 は、トップ MB についての第 1 イントラ予測ステップ S 531 と、ボトム MB についての第 2 イントラ予測ステップ S 532 を備えている。第 1 イントラ予測ステップ S 531 は、選択された符号化ピクチャ構造ブロックペア  
25 (この場合はフィールド構造ブロックペア 75, 76) のトップ MB 75 についてイントラ符号化コスト cost\_top2 を導出し、符号化予測方式決定ステップ S 54 に提供する。第 2 イントラ予測ステップ S 532 は、選択された符号化ピクチャ構造ブロックペア (この場合はフィールド構造ブロックペア 75, 76) のボトム MB 76 についてイントラ符号化コスト cost\_bot2 を導出し、符号化予測方

式決定ステップS 5 4に提供する。なお、この実施形態では、cost top2は1500であり、cost bot2は1400である。また、イントラ予測は、処理量を減らすため、画素を間引いて精度を落とした処理であっても良いし、さらにはイントラ4×4を省略しても良い。

5    符号化予測方式決定ステップS 5 4は、インター予測結果とイントラ予測結果とに基づいて、決定された符号化ピクチャ構造を有するブロックペアの各ブロックに対する符号化予測方式を決定する。具体的には、符号化予測方式決定ステップS 5 4は、トップMBについての第1符号化予測方式決定ステップS 5 4 1と、ボトムMBについての第2符号化予測方式決定ステップS 5 4 2とを備えている。

10    第1符号化予測方式決定ステップS 5 4 1は、符号化ピクチャ構造決定ステップS 5 2からのトップMBのインター符号化コスト（具体的には、フィールド構造ブロックペア75, 76のトップMB 75のインター符号化コスト cost top1）と、第1イントラ予測ステップS 5 3 1からのトップMB 75のイントラ符号化コスト cost top2を比較し、トップMBについてのイントラ／インター選択を行う。この場合は、インター符号化コスト cost top1(1400)がイントラ符号化コスト cost top2(1500)より小さいため、インターが選択される。第2符号化予測方式決定ステップS 5 4 2は、符号化ピクチャ構造決定ステップS 5 2からのボトムMBのインター符号化コスト（具体的には、フィールド構造ブロックペア75, 76のボトムMB 76のインター符号化コスト cost bot1）と、第2イントラ予測ステップS 5 3 2からのボトムMB 76のイントラ符号化コスト cost bot2を比較し、ボトムMB 76についてのイントラ／インター選択を行う。この場合は、この場合は、インター符号化コスト cost bot1(1300)がイントラ符号化コスト cost bot2(1400)より小さいため、インターが選択される。

25    なお、本実施形態ではトップMBとボトムMBで符号化予測方式（イントラ／インター）は同一になったが、異なることもある。ただし、トップMBとボトムMBで異なる符号化ピクチャ構造で符号化されることは無い。符号化ピクチャ構造決定ステップS 5 2で符号化ピクチャ構造が決定されているからである。

この実施形態では、イントラ予測ステップS 5 3は符号化ピクチャ構造決定ステップS 5 2によって決定された符号化ピクチャ構造の画像ブロックペアについ

てのみイントラ予測を行うため、イントラ予測ステップS 5 3はフィールド構造ブロックおよびフレーム構造ブロックの全てについてイントラ予測を行う必要がない。このように処理負荷の高いイントラ予測の回数を減らすことができるため、画像ブロックペアの符号化予測方式を決定するための処理負荷を削減できる。

## 5 〈変形例〉

第2実施形態では、第1実施形態で記載した内容を適宜変形して適用可能である。ここでは、第2実施形態に特徴的な変形例について記載する。

### (1)

上記実施形態では、第1～第4インター予測ステップS 5 1 1～ステップS 5 1 4は、フルペル予測とサブペル予測の両方を行っても良いと記載した。

ここで、フルペル予測とサブペル予測との両方を行う場合には、フルペル予測により絞り込まれたパーティションサイズ、参照ピクチャ、ピクチャ構造の組み合わせに対して、サブペル予測を行うものであっても良い。より具体的には、図18に示すように、整数画素精度の動き推定により、適切なパーティションサイズ、参照ピクチャ、ピクチャ構造の組み合わせを選択し（ステップS 7 1 0）、選択された組み合わせに対して非整数画素精度の動き推定により、さらに絞り込みを行う（ステップS 7 1 1）。さらに、絞り込みの結果として得られるパーティションサイズ、参照ピクチャ、ピクチャ構造の組み合わせに対して、イントラ予測を行い（ステップS 7 1 2）、イントラ予測・インター予測の選択を行う。

これにより全パーティションサイズ、全参照ピクチャ、全ピクチャ構造について非整数画素精度の動き推定とイントラ予測とを行う必要が無く、処理量を削減することが可能となる。

### (2)

上記実施形態では、画像ブロックペア7 3という単位で入力画像信号3 0を符号化する装置について説明した。ここで、符号化は、画像ブロックペア単位で行われなくてもよい。例えば、正方の画像ブロックを単位として符号化が行われてもよい。この場合、上記実施形態で説明した方法は、矩形のフィールド構造ブロックペアと矩形のフレーム構造ブロックペアとに対して適用される。

[第3実施形態]

図19～図20を用いて、本発明の第3実施形態としてのエンコーダについて説明する。

〈エンコーダ1の構成〉

図19に示すエンコーダ60は、入力画像信号30のイントラ予測を行いうイン5 トラ予測部91と、入力画像信号30のインター予測を行いうインター予測部92と、符号化モード決定部93と、イントラ予測およびインター予測の予測結果を切り換える切換部94と、切換部94の出力を符号化して符号化画像信号31を出力する符号化部5と、入力画像信号30のローカルデコード信号32を作成する参照画像作成部6とを備えている。

10 イントラ予測部91は、簡易なイントラ予測と複雑なイントラ予測が可能である。簡易なイントラ予測とは、例えば、圧縮画像に対するイントラ予測であり、複雑なイントラ予測とは、例えば、非圧縮画像に対するイントラ予測である。イントラ予測部91は、符号化モード決定部93内の制御部99（後述）により制御され、簡易なイントラ予測を行い、符号化コスト導出する。その結果、イント15 ラ予測部91は、入力画像信号30を画像ブロック毎にイントラ予測し、イントラ予測結果を切換部94に出力する。

20 インター予測部92は、入力画像信号30を第1の入力とし、ローカルデコード信号32を第2の入力として、インター予測結果を切換部94に出力する。さらに、インター予測部92は、インター予測結果のうち、動きベクトルなど符号化にかかる情報を第2の出力として符号化部5に出力する。

25 インター予測部92は、入力画像信号30を第1の入力、ローカルデコード信号32を第2の入力とし、動き推定を行う動き推定部95と、動き推定部95の出力を第1の入力、ローカルデコード信号32を第2の入力とし、予測画像を出力する予測画像作成部11と、入力画像信号30を第1の入力、予測画像作成部11の出力を第2の入力とする減算部12とから構成されている。動き推定部95は、フルペル・インター予測もしくはサブペル・インター予測を行い、符号化コスト導出する。また、動き推定部95の出力のうち、動きベクトルや符号化モードなどの符号化情報は、可変長符号化部22の入力にも与えられる。

切換部94は、イントラ予測結果を第1の入力、インター予測結果を第2の入

力とし、符号化モード決定部93からの切換信号に従って、いずれかの入力を符号化部5に出力する。

符号化部5及び参照画像作成部6の構造及び機能は前記実施形態と同様であるため、ここでは説明を省略する。

5 符号化モード決定部93は、決定部96と、制御部99とを有している。決定部96は、イントラ／インター選択部97と、符号化ピクチャ構造決定部98とを有している。決定部96は、動き推定部95からの符号化コストと、イントラ予測部91からの符号化コストを入力としている。イントラ／インター選択部97がイントラ／インターを決定する。符号化ピクチャ構造決定部98がフィールド／フレームを決定する。制御部99が、イントラ予測部91または動き推定部95を制御して、決定された符号化ピクチャ構造の画像ブロックペア73に動き推定をさせる。つまり、制御部99は、イントラ予測部91に複雑なイントラ予測を行わさせ、または動き推定部95にサブペル・インター予測を行わせる。制御部99は、さらに切換部94を動作させ、イントラ予測結果あるいはインター予測結果を符号化させる。

10

15

なお、制御部は、エンコーダ90のどこかに有ればよい。符号化モード決定部93が備えていなくても良い。

20 図20は、画像ブロックペア73の符号化モード決定の処理動作のフローである。この処理動作は、イントラ予測部91又は動き推定部95によって実行される簡易動き推定ステップS61と、イントラ／インター選択部97によって実行されるイントラ／インター選択ステップS62と、符号化ピクチャ構造決定部98によって実行される画像ブロックペア73の符号化ピクチャ構造決定ステップS63とを備えている。なお、符号化ピクチャ構造決定ステップS63の次には、イントラ予測部91又は動き推定部95によって実行される複雑動き推定ステップS64とを備えている。

25

簡易動き推定ステップS61は、フレーム／フィールド構造のトップMB及びボトムMBに対して、フルペル・インター予測と簡易イントラ予測を行って、それらの符号化コストを導出する。簡易動き推定ステップS61は、第1～第8推定ステップS611～S618を備えている。第1推定ステップS611はフレ

ーム構造ブロックペア 77, 78 のトップ MB 77 に対してフルペル・インター予測を行い、第 2 推定ステップ S 612 はフレーム構造ブロックペア 77, 78 のトップ MB 77 に対して簡易・イントラ予測を行う。第 3 推定ステップ S 613 はフレーム構造ブロックペア 77, 78 のボトム MB 78 に対してフルペル・  
5 インター予測を行い、第 4 推定ステップ S 614 はフレーム構造ブロックペア 77, 78 のボトム MB 78 に対して簡易イントラ予測を行う。第 5 推定ステップ S 615 はフィールド構造ブロックペア 75, 76 のトップ MB 75 に対してフルペル・インター予測を行い、第 6 推定ステップ S 616 はフィールド構造ブロ  
ックペア 75, 76 のトップ MB 75 に対して簡易イントラ予測を行う。第 7 推  
10 定ステップ S 617 はフィールド構造ブロックペア 75, 76 のボトム MB 76 に対してフルペル・インター予測を行い、第 8 推定ステップ S 818 はフィール  
ド構造ブロックペア 75, 76 のボトム MB 76 に対して簡易イントラ予測を行  
う。このように簡易動き推定ステップ S 61 がインター予測とイントラ予測を用  
いてフレーム構造ブロックペア 77, 78 及びフィールド構造ブロックペア 75  
15 , 76 の符号化コストを導出するため、インター予測又はイントラ予測のいずれ  
かで圧縮率が向上する画像ブロックペア 73 (71, 72) の場合でも、圧縮率  
が最良となるような符号化ピクチャ構造を決定できる。

イントラ/インター選択ステップ S 62 は、(フレーム、フィールド) \* (ト  
ップ、ボトム) の 4 種類それぞれで、イントラ、インターの符号化コストを比較  
20 し、小さい方を選択する。

イントラ/インター選択ステップ S 62 は、第 1 ~ 第 4 選択ステップ S 621  
~ ステップ S 624 を備えている。第 1 選択ステップ S 621 は、第 1 推定ステ  
ップ S 611 及び第 2 推定ステップ S 612 の符号化コストを比較して、フレ  
ーム構造トップ MB 77 に対するイントラ/インターを選択する。この場合は、第  
25 2 推定ステップ S 612 の符号化コスト (1300) を選択する。第 2 選択ステップ S  
622 は、第 3 推定ステップ S 613 及び第 4 推定ステップ S 614 の符号化コ  
ストを比較して、フレーム構造ボトム MB 78 に対するイントラ/インターを選  
択する。この場合は、第 4 推定ステップ S 614 の符号化コスト (1200) を選択す  
る。イントラ/インターが選択されたフレーム構造 トップ MB 77 の符号化コス

ト(1300)とボトムMB 7 8の符号化コスト(1200)は合計され、フレーム構造ブロックペア7 7, 7 8の符号化コスト(2500)が得られる。第3選択ステップS 6 2 3は、第5推定ステップS 6 1 5及び第6推定ステップS 6 1 6の符号化コストを比較して、フィールド構造トップMB 7 5, 7 6に対するイントラ／インターを選択する。この場合は、第5推定ステップS 6 1 5の符号化コスト(1400)を選択する。第4選択ステップS 6 2 4は、第7推定ステップS 6 1 7及び第8推定ステップS 6 1 8の符号化コストを比較して、フィールド構造ボトムMB 7 6に対するイントラ／インターを選択する。この場合は、第7推定ステップS 6 1 7の符号化コスト(1300)を選択する。イントラ／インターが選択されたフィールド構造トップMB 7 5の符号化コスト(1400)とボトムMB 7 6の符号化コスト(1300)は合計され、フィールド構造ブロックペア7 5, 7 6の符号化コスト(2700)が得られる。

符号化ピクチャ構造決定ステップS 6 3は、フレーム構造ブロックペア7 7, 7 8の符号化コストとフィールド構造ブロックペア7 5, 7 6の符号化コストとを比較し、画像ブロックペア7 3のフィールド／フレームを決定する。この場合は、フレーム構造ブロックペア7 7, 7 8の符号化コスト(2500)はフィールド構造ブロックペア7 5, 7 6の符号化コスト(2700)より小さいため、フレーム構造ブロックペア7 7, 7 8が選択される。

複雑動き推定ステップS 6 4は、決定された符号化ピクチャ構造の画像ブロックペア7 3のトップMB及びボトムMB 7 7, 7 8それぞれに対して、複雑な動き推定(サブペル／インター又は複雑イントラの一方)を行う。複雑動き推定ステップS 6 4は、第1～第4推定ステップS 6 4 1～S 6 4 4を備えている。第1推定ステップS 6 4 1は、トップMB 7 7に対するサブペル・インター予測を行う。第2推定ステップS 6 4 2は、トップMB 7 7に対する複雑イントラ予測を行う。なお、第1推定ステップS 6 4 1と第2推定ステップS 6 4 2はいずれか一方のみが実行される。第3推定ステップS 6 4 3は、ボトムMB 7 8に対するサブペル・インター予測を行う。第4推定ステップS 6 4 4は、ボトムMB 7 8に対する複雑イントラ予測を行う。なお、第3推定ステップS 6 4 3と第4推定ステップS 6 4 4はいずれか一方のみが実行される。

以上に述べたように、簡易動き推定ステップS 6 1の簡易なインター予測・イントラ予測に基づいて、符号化ピクチャ構造決定ステップS 6 3によって、符号化モード（具体的には、符号化ピクチャ構造）を決定している。このため、符号化モードを決定するための処理量を軽減することが可能となる。

5 また、符号化モードが決定された後に複雑動き推定ステップS 6 4が複雑な動き推定を行っている。このように、複雑な予測によって画像ブロックペア7 3の符号化を行うため、圧縮効率が向上する。しかも、ここでは、決定された符号化ピクチャ構造の画像ブロックペア7 3に対してのみ複雑な予測を行うため、従来より複雑な予測の回数を減らすことができる。この結果、符号化効率を維持しながらも処理量を減らすことができる。

なお、トップMBとボトムMBで異なる符号化ピクチャ構造で符号化されることは無いが、異なる符号化予測方式（イントラ／インター）で符号化されることはある。

15 なお、第3実施形態では、第1～第2実施形態で記載した内容を適宜変形して適用可能である。

#### [第4実施形態]

さらにここで、上記実施の形態で示した動画像符号化装置の応用例とそれを用いたシステムを説明する。

20 図2 1は、コンテンツ配信サービスを実現するコンテンツ供給システム ex 1 0 0 の全体構成を示すブロック図である。通信サービスの提供エリアを所望の大きさに分割し、各セル内にそれぞれ固定無線局である基地局 ex 1 0 7～ex 1 1 0 が設置されている。

25 このコンテンツ供給システム ex 1 0 0 は、例えば、インターネット ex 1 0 1 にインターネットサービスプロバイダ ex 1 0 2 および電話網 ex 1 0 4、および基地局 ex 1 0 7～ex 1 1 0 を介して、コンピュータ ex 1 1 1、PDA (personal digital assistant) ex 1 1 2、カメラ ex 1 1 3、携帯電話 ex 1 1 4、カメラ付きの携帯電話 ex 1 1 5などの各機器が接続される。

しかし、コンテンツ供給システム ex 1 0 0 は図2 1のような組合せに限定されず、いずれかを組み合わせて接続するようにしてもよい。また、固定無線局で

ある基地局 ex107～ex110を介さずに、各機器が電話網 ex104に直接接続されてもよい。

カメラ ex113はデジタルビデオカメラ等の動画撮影が可能な機器である。

また、携帯電話は、PDC (Personal Digital Communications) 方式、CDM

5 A (Code Division Multiple Access) 方式、W-CDMA (Wideband-Code Division Multiple Access) 方式、若しくはGSM (Global System for Mobile Communications) 方式の携帯電話機、またはPHS (Personal Handyphone System) 等であり、いずれでも構わない。

また、ストリーミングサーバ ex103は、カメラ ex113から基地局 ex10

10 9、電話網 ex104を通じて接続されており、カメラ ex113を用いてユーザが送信する符号化処理されたデータに基づいたライブ配信等が可能になる。撮影したデータの符号化処理はカメラ ex113で行っても、データの送信処理をするサーバ等で行ってもよい。また、カメラ ex116で撮影した動画データはコンピュータ ex111を介してストリーミングサーバ ex103に送信されてもよい。

15 カメラ ex116はデジタルカメラ等の静止画、動画が撮影可能な機器である。この場合、動画データの符号化はカメラ ex116で行ってもコンピュータ ex111で行ってもどちらでもよい。また、符号化処理はコンピュータ ex111やカメラ ex116が有するLSI ex117において処理することになる。なお、画像符号化・復号化用のソフトウェアをコンピュータ ex111等で読み取り可能な記録媒体である何らかの蓄積メディア (CD-ROM、フレキシブルディスク、ハードディスクなど) に組み込んでもよい。さらに、カメラ付きの携帯電話 ex115で動画データを送信してもよい。このときの動画データは携帯電話 ex115が有するLSIで符号化処理されたデータである。

20 このコンテンツ供給システム ex100では、ユーザがカメラ ex113、カメラ ex116等で撮影しているコンテンツ (例えば、音楽ライブを撮影した映像等) を上記実施の形態同様に符号化処理してストリーミングサーバ ex103に送信する一方で、ストリーミングサーバ ex103は要求のあったクライアントに対して上記コンテンツデータをストリーム配信する。クライアントとしては、上記符号化処理されたデータを復号化することが可能な、コンピュータ ex11

1、PDA ex112、カメラ ex113、携帯電話 ex114等がある。このよう  
にすることでコンテンツ供給システム ex100は、符号化されたデータをク  
ライアントにおいて受信して再生することができ、さらにクライアントにおいてリ  
アルタイムで受信して復号化し、再生することにより、個人放送をも実現可能に  
5 なるシステムである。

このシステムを構成する各機器の符号化には上記各実施の形態で示した動画像  
符号化装置を用いるようにすればよい。

その一例として携帯電話について説明する。

図22は、上記実施の形態で説明した動画像符号化装置を用いた携帯電話 ex  
10 115を示す図である。携帯電話 ex115は、基地局 ex110との間で電波を  
送受信するためのアンテナ ex201、CCDカメラ等の映像、静止画を撮るこ  
とが可能なカメラ部 ex203、カメラ部 ex203で撮影した映像、アンテナ ex  
15 201で受信した映像等が復号化されたデータを表示する液晶ディスプレイ等の  
表示部 ex202、操作キー ex204群から構成される本体部、音声出力をす  
るためのスピーカ等の音声出力部 ex208、音声入力をするためのマイク等の  
音声入力部 ex205、撮影した動画もしくは静止画のデータ、受信したメール  
のデータ、動画のデータもしくは静止画のデータ等、符号化されたデータまたは  
復号化されたデータを保存するための記録メディア ex207、携帯電話 ex11  
5に記録メディア ex207を装着可能とするためのスロット部 ex206を有し  
20 ている。記録メディア ex207はSDカード等のプラスチックケース内に電気  
的に書換えや消去が可能な不揮発性メモリであるEEPROM (Electrically  
Erasable and Programmable Read Only Memory) の一種であるフラッシュメ  
モリ素子を格納したものである。

さらに、携帯電話 ex115について図23を用いて説明する。携帯電話 ex1  
25 15は表示部 ex202及び操作キー ex204を備えた本体部の各部を統括的  
に制御するようになされた主制御部 ex311に対して、電源回路部 ex310、  
操作入力制御部 ex304、画像符号化部 ex312、カーラインインターフェース部  
ex303、LCD (Liquid Crystal Display) 制御部 ex302、画像復号化部  
ex309、多重分離部 ex308、記録再生部 ex307、変復調回路部 ex306

及び音声処理部 ex305 が同期バス ex313 を介して互いに接続されている。

電源回路部 ex310 は、ユーザの操作により終話及び電源キーがオン状態にされると、バッテリパックから各部に対して電力を供給することによりカメラ付ディジタル携帯電話 ex115 を動作可能な状態に起動する。

5 携帯電話 ex115 は、CPU、ROM 及び RAM 等でなる主制御部 ex311 の制御に基づいて、音声通話モード時に音声入力部 ex205 で集音した音声信号を音声処理部 ex305 によってディジタル音声データに変換し、これを変復調回路部 ex306 でスペクトラム拡散処理し、送受信回路部 ex301 でディジタルアナログ変換処理及び周波数変換処理を施した後にアンテナ ex201 を介して送信する。また携帯電話機 ex115 は、音声通話モード時にアンテナ ex201 で受信した受信信号を增幅して周波数変換処理及びアナログディジタル変換処理を施し、変復調回路部 ex306 でスペクトラム逆拡散処理し、音声処理部 ex305 によってアナログ音声信号に変換した後、これを音声出力部 ex208 を介して出力する。

10 15 さらに、データ通信モード時に電子メールを送信する場合、本体部の操作キー ex204 の操作によって入力された電子メールのテキストデータは操作入力制御部 ex304 を介して主制御部 ex311 に送出される。主制御部 ex311 は、テキストデータを変復調回路部 ex306 でスペクトラム拡散処理し、送受信回路部 ex301 でディジタルアナログ変換処理及び周波数変換処理を施した後に 20 アンテナ ex201 を介して基地局 ex110 へ送信する。

データ通信モード時に画像データを送信する場合、カメラ部 ex203 で撮像された画像データをカメラインターフェース部 ex303 を介して画像符号化部 ex312 に供給する。また、画像データを送信しない場合には、カメラ部 ex203 で撮像した画像データをカメラインターフェース部 ex303 及び LCD 制御部 ex302 を介して表示部 ex202 に直接表示することも可能である。

画像符号化部 ex312 は、本願発明で説明した画像符号化装置を備えた構成であり、カメラ部 ex203 から供給された画像データを上記実施の形態で示した画像符号化装置に用いた符号化方法によって圧縮符号化することにより符号化画像データに変換し、これを多重分離部 ex308 に送出する。また、このとき

同時に携帯電話機 ex115 は、カメラ部 ex203 で撮像中に音声入力部 ex205 で集音した音声を音声処理部 ex305 を介してデジタルの音声データとして多重分離部 ex308 に送出する。

多重分離部 ex308 は、画像符号化部 ex312 から供給された符号化画像データと音声処理部 ex305 から供給された音声データとを所定の方式で多重化し、その結果得られる多重化データを変復調回路部 ex306 でスペクトラム拡散処理し、送受信回路部 ex301 でデジタルアナログ変換処理及び周波数変換処理を施した後にアンテナ ex201 を介して送信する。

データ通信モード時にホームページ等にリンクされた動画像ファイルのデータを受信する場合、アンテナ ex201 を介して基地局 ex110 から受信した受信信号を変復調回路部 ex306 でスペクトラム逆拡散処理し、その結果得られる多重化データを多重分離部 ex308 に送出する。

また、アンテナ ex201 を介して受信された多重化データを復号化するには、多重分離部 ex308 は、多重化データを分離することにより画像データの符号化ビットストリームと音声データの符号化ビットストリームとに分け、同期バス ex313 を介して当該符号化画像データを画像復号化部 ex309 に供給すると共に当該音声データを音声処理部 ex305 に供給する。

次に、画像復号化部 ex309 は、画像データの符号化ビットストリームを上記実施の形態で示した符号化方法に対応した復号化方法で復号することにより再生動画像データを生成し、これをLCD制御部 ex302 を介して表示部 ex202 に供給し、これにより、例えばホームページにリンクされた動画像ファイルに含まれる動画データが表示される。このとき同時に音声処理部 ex305 は、音声データをアナログ音声信号に変換した後、これを音声出力部 ex208 に供給し、これにより、例えばホームページにリンクされた動画像ファイルに含まる音声データが再生される。

なお、上記システムの例に限られず、最近は衛星、地上波によるデジタル放送が話題となっており、図24に示すようにデジタル放送用システムにも上記実施の形態の画像符号化装置を組み込むことができる。具体的には、放送局 ex409 では映像情報の符号化ビットストリームが電波を介して通信または放送衛

星 ex410 に伝送される。これを受けた放送衛星 ex410 は、放送用の電波を発信し、この電波を衛星放送受信設備をもつ家庭のアンテナ ex406 で受信し、テレビ（受信機） ex401 またはセットトップボックス（STB） ex407 などの装置により符号化ビットストリームを復号化してこれを再生する。また、記録媒体である CD や DVD 等の蓄積メディア ex402 に記録した符号化ビットストリームを読み取り、復号化する再生装置 ex403 にも上記実施の形態で示した画像復号化装置を実装することが可能である。この場合、再生された映像信号はモニタ ex404 に表示される。また、ケーブルテレビ用のケーブル ex405 または衛星／地上波放送のアンテナ ex406 に接続されたセットトップボックス ex407 内に画像復号化装置を実装し、これをテレビのモニタ ex408 で再生する構成も考えられる。このときセットトップボックスではなく、テレビ内に画像復号化装置を組み込んでも良い。また、アンテナ ex411 を有する車 ex412 で衛星 ex410 からまたは基地局 ex107 等から信号を受信し、車 ex412 が有するカーナビゲーション ex413 等の表示装置に動画を再生することも可能である。

更に、画像信号を上記実施の形態で示した画像符号化装置で符号化し、記録媒体に記録することもできる。具体例としては、DVD ディスク ex421 に画像信号を記録する DVD レコーダや、ハードディスクに記録するディスクレコーダなどのレコーダ ex420 がある。更に SD カード ex422 に記録することもできる。レコーダ ex420 が上記実施の形態で示した画像復号化装置を備えていれば、DVD ディスク ex421 や SD カード ex422 に記録した画像信号を再生し、モニタ ex408 で表示することができる。

なお、カーナビゲーション ex413 の構成は例えば図 23 に示す構成のうち、カメラ部 ex203 とカメラインターフェース部 ex303、画像符号化部 ex312 を除いた構成が考えられ、同様なことがコンピュータ ex111 やテレビ（受信機） ex401 等でも考えられる。

また、上記携帯電話 ex114 等の端末は、符号化器・復号化器を両方持つ送受信型の端末の他に、符号化器のみの送信端末、復号化器のみの受信端末の 3 通りの実装形式が考えられる。

このように、上記実施の形態で示した動画像符号化装置を上述したいずれの機器・システムに用いることは可能であり、そうすることで、上記実施の形態で説明した効果を得ることができる。

[全実施形態共通の変形例]

5 (1)

前記実施形態では、 $16 \times 16$  のマクロブロックを各分割候補によって分割したマクロブロックパーティションを小ブロックとして動き推定の単位として扱ってきた。この場合、図 25 に示すように、 $8 \times 8$  の分割方法で得られた小ブロックをさらに $8 \times 8$ 、 $8 \times 4$ 、 $4 \times 8$ 、 $4 \times 4$  のサブマクロブロックパーティションに分割することができ、このサブマクロブロックパーティションを本発明の小ブロックとして本発明を適用できる。

10 (2)

ブロック図（例えば、図 1、図 16、図 19、図 23 など）の各機能ブロックは典型的には集積回路である LSI として実現される。これらは個別に 1 チップ化されても良いし、一部又は全てを含むように 1 チップ化されても良い。

より具体的には、図 1 の動き推定部 10 は、1 チップ化されてもよい。さらに、図 1 のメモリ 26 以外の機能ブロックが 1 チップ化されていてもよい。また、図 16 のインター予測部 3 と符号化モード決定部 63 とイントラ予測部 61 とが 1 チップ化されてもよい。さらに図 16 のメモリ 26 以外の機能ブロックが 1 チップ化されていてもよい。また、図 19 のインター予測部 92 と符号化モード決定部 93 とが 1 チップ化されてもよい。さらに、図 19 のメモリ以外の機能ブロックが 1 チップ化されていてもよい。

なおここでは、LSI としたが、集積度の違いにより、IC、システム LSI、スーパー LSI、ウルトラ LSI と呼称されることもある。

25 また、集積回路化の手法は LSI に限るものではなく、専用回路又は汎用プロセサで実現してもよい。LSI 製造後に、プログラムすることが可能な FPGA (Field Programmable Gate Array) や、LSI 内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサーを利用しても良い。

さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。

## 5 (産業上の利用可能性)

本発明に係る符号化モード決定装置、画像符号化装置、符号化モード決定方法、および符号化モード決定プログラムにより、より少ない処理量で適切な符号化モードの選択が可能となり、上記分野において有用である。

## 請 求 の 範 囲

1.

画像ブロックの符号化モードを複数候補の中から少なくとも1つに決定する符

5 号化モード決定装置であって、

各符号化モードによってそれぞれ得られる画像ブロックのパーティションである小ブロックに対する簡易な動き推定に基づいて、各符号化モードの符号化コストを導出する簡易動き推定部と、

前記簡易動き推定部によって導出された符号化コストに基づいて、前記複数の

10 符号化モードから一部の符号化モードを選択する符号化モード選択部と、

前記一部の符号化モードの少なくとも一部の符号化モードによって得られる小ブロックに対する複雑な動き推定に基づいて、各符号化モードの符号化コストを導出する複雑動き推定部と、

前記複雑動き推定部によって導出された符号化コストに基づいて、前記画像ブ

15 ロックの符号化モードを決定する符号化モード決定部と、

を備える符号化モード決定装置。

2.

前記簡易動き推定部は、各符号化モードの符号化コストを導出する際に、各符号化モードによって得られる小ブロックごとに複数のピクチャ参照方向の簡易な動き推定を行って符号化コストを算出し、次に各小ブロックごとに符号化コストが低いピクチャ参照方向を選択し、次に選択したピクチャ参照方向に関する全ての小ブロックの符号化コストを各分割方法候補ごとに合計して、各分割方法候補ごとの符号化モードの符号化コストを導出する。

請求項1に記載の符号化モード決定装置。

25 3.

前記簡易動き推定部は、各符号化モードの符号化コストを導出する際に、各符号化モードによって得られる小ブロックごとに複数のピクチャ参照方向の簡易な動き推定を行って符号化コストを算出し、次に小ブロックの各ピクチャ参照方向ごとの符号化コストを画像ブロック単位に換算して、各分割候補の各ピクチャ参

照方向ごとの符号化モードの符号化コストを導出する、

請求項 1 に記載の符号化モード決定装置。

4.

前記簡易動き推定部の前記複数のピクチャ参照方向の簡易な動き推定は、時間

5 的に前方向のピクチャを参照する前方向予測と、時間的に後方向のピクチャを参  
照する後方向予測のみを含む、

請求項 2 又は 3 に記載の符号化モード決定装置。

5.

前記簡易動き推定部の前記複数のピクチャ参照方向の簡易な動き推定は、時間

10 的に前方向のピクチャを参照する前方向予測と、時間的に後方向のピクチャを参  
照する後方向予測と、時間的に双方向のピクチャを参照する双方向予測とを含む

請求項 2 又は 3 に記載の符号化モード決定装置。

6.

15 前記簡易動き推定部の前記複数のピクチャ参照方向の簡易な動き推定は、時間  
的に前方向のピクチャを参照する前方向予測と、時間的に後方向のピクチャを参  
照する後方向予測とを含み、

20 前記簡易動き推定部は、前記前方向予測と前記後方向予測とに基づいて、時間  
的に双方向のピクチャを参照する双方向予測を行った場合の符号化コストを導出  
する、

請求項 2 又は 3 に記載の符号化モード決定装置。

7.

前記複雑動き推定部は、前記簡易動き推定部における簡易な動き推定に基づい  
て、前記複雑な動き推定の際のピクチャ参照方向を決定する、

25 請求項 1 ~ 6 のいずれかに記載の符号化モード決定装置。

8.

前記複雑動き推定部は、前記簡易動き推定部における前記小ブロックに対する  
簡易な動き推定の結果、前方向予測と後向予測の符号化コストが概ね同じ場合は  
両方を選択し、異なる場合は符号化コストが小さい方のみを選択する、

請求項 7 に記載の符号化モード決定装置。

9.

前記複雑動き推定部は、前記簡易動き推定部における前記小ブロックに対する簡易な動き推定に基づいて、前記一部の符号化モードからさらに少なくとも一部  
5 の符号化モードを選択する。

請求項 1 ~ 8 のいずれかに記載の符号化モード決定装置。

10.

前記複雑動き推定部は、各符号化モードを符号化コストが低い順に選択してい  
き、選択した符号化モードの符号化コストの和が処理余裕量を超える直前に選択  
10 を打ち切る。

請求項 9 に記載の符号化モード決定装置。

11.

前記簡易動き推定部あるいは前記複雑動き推定部は、動き推定処理の処理量が  
ほぼ一定に保たれるように、前記簡易動き推定あるいは前記複雑動き推定にお  
ける動き推定方式を変化させる。  
15

請求項 1 ~ 10 のいずれかに記載の符号化モード決定装置。

12.

前記簡易な動き推定は、整数画素精度の動き推定であり、

前記複雑な動き推定は、非整数画素精度の動き推定である。

20 請求項 1 ~ 11 のいずれかに記載の符号化モード決定装置。

13.

請求項 1 ~ 12 のいずれかに記載の符号化モード決定装置を含む、  
集積回路。

14.

25 請求項 1 ~ 12 のいずれかに記載の符号化モード決定装置と、  
前記符号化モード決定装置が決定する画像ブロックの符号化モードに基づいて  
、前記画像ブロックの符号化を行う符号化装置と、  
を備える画像符号化装置。

15.

請求項 14 に記載の画像符号化装置を含む、  
集積回路。

16.

画像ブロックの符号化モードを決定する符号化モード決定装置であって、

5 前記画像ブロックのフィールド構造ブロックおよびフレーム構造ブロックの各  
ブロックについてインター予測を行って、符号化コストを導出するインター予測  
部と、

前記インター予測部による符号化コストに基づいて、前記画像ブロックの符号  
化ピクチャ構造を決定する符号化ピクチャ構造決定部と、

10 決定された前記符号化ピクチャ構造を有する各ブロックについてイントラ予測  
を行って、符号化コストを導出するイントラ予測部と、

前記インター予測による符号化コストと前記イントラ予測による符号化コスト  
を比較して、決定された前記符号化ピクチャ構造を有する画像ブロックの各ブロ  
ックに対する符号化予測方式を決定する符号化予測方式決定部と、

15 を備える符号化モード決定装置。

17.

前記インター予測部は、前記フレーム構造ブロックの各ブロックの符号化コス  
トを合計して前記フレーム構造ブロックの符号化コストを導出し、前記フィール  
ド構造ブロックの各ブロックの符号化コストを合計して前記フィールド構造ブロ  
ックの符号化コストを導出する、請求項 16 に記載の符号化モード決定装置。

18.

前記イントラ予測部は、決定された前記符号化ピクチャ構造を有する各ブロッ  
クについてイントラ予測を行って符号化コストを導出し、

前記符号化予測方式決定部は、決定された前記符号化ピクチャ構造を有する各  
25 ブロックについて、前記インター予測部で導出された符号化コストと前記イント  
ラ予測部で導出された符号化コストとを比較し、各ブロックごとに符号化予測方  
式を決定する、

請求項 17 に記載の符号化モード決定装置。

19.

前記画像ブロックは、2つの正方ブロックから構成されているブロックペアである。

請求項16～18のいずれかに記載の符号化モード決定装置。

20.

5 請求項16～19のいずれかに記載の符号化モード決定装置を含む、集積回路。

21.

請求項16～19のいずれかに記載の符号化モード決定装置と、

前記符号化モード決定装置が決定する画像ブロックの符号化モードに基づいて

10 、前記画像ブロックの符号化を行う符号化装置と、  
を備える画像符号化装置。

22.

請求項21に記載の画像符号化装置を含む、  
集積回路。

15 2.3.

画像ブロックの符号化モードを決定する符号化モード決定装置であって、

前記画像ブロックのフィールド構造ブロックおよびフレーム構造ブロックのそれぞれのブロックに対して簡易な動き推定によって符号化コストを導出する簡易動き推定部と、

20 前記簡易動き推定部による符号化コストに基づいて、前記画像ブロックのフィールド構造ブロックおよびフレーム構造ブロックの符号化コストを比較し、符号化ピクチャ構造を決定する符号化ピクチャ構造決定部と、  
を備える符号化モード決定装置。

24.

25 前記簡易動き推定部は、各ブロックに対して簡易なインター予測と簡易なイントラ予測を行い、次に簡易なインター予測の符号化コストと簡易なイントラ予測の符号化コストを比較し各ブロックごとに簡易なインター予測と簡易なイントラ予測のいずれかを選択し、さらに各ピクチャ構造ごとのブロックの符号化コストを合計してフレーム構造ブロック及びフィールド構造ブロックの符号化コストを

導出する。

請求項 2 3 に記載の符号化モード決定装置。

2 5.

前記簡易なインター予測は、整数画素精度のインター予測である。

5 請求項 2 4 に記載の符号化モード決定装置。

2 6.

前記画像ブロックは、2つの正方ブロックから構成されているブロックペアである。

請求項 2 3 ~ 2 5 のいずれかに記載の符号化モード決定装置。

10 2 7.

請求項 2 3 ~ 2 6 のいずれかに記載の符号化モード決定装置を含む、集積回路。

2 8.

請求項 2 3 ~ 2 6 のいずれかに記載の符号化モード決定装置と、

15 前記符号化モード決定装置によって決定される符号化ピクチャ構造の画像ブロックに対して複雑な動き推定を行う複雑動き推定部と、

前記複雑動き推定部による予測結果に基づいて、前記画像ブロックの符号化を行う符号化部と、

を備える画像符号化装置。

20 2 9.

前記複雑動き推定部は、決定された符号化ピクチャ構造を有する各ブロックに対して、複雑なインター予測又は複雑なイントラ予測を行う、

請求項 2 8 に記載の画像符号化装置。

3 0.

25 前記複雑なインター予測は、非整数画素精度のインター予測である、  
請求項 2 9 に記載の画像符号化装置。

3 1.

請求項 2 8 ~ 3 0 のいずれかに記載の画像符号化装置を含む、  
集積回路。

## 3 2.

画像ブロックの符号化モードを複数候補の中から少なくとも1つに決定する符号化モード決定方法であって、

各符号化モードによってそれぞれ得られる画像ブロックのパーティションである小ブロックに対する簡易な動き推定に基づいて、各符号化モードの符号化コストを導出する簡易動き推定ステップと、

前記簡易動き推定ステップによって導出された符号化コストに基づいて、前記複数の符号化モードから一部の符号化モードを選択する符号化モード選択ステップと、

前記一部の符号化モードの少なくとも一部の符号化モードによって得られる小ブロックに対する複雑な動き推定に基づいて、各符号化モードの符号化コストを導出する複雑動き推定ステップと、

前記複雑動き推定ステップによって導出された符号化コストに基づいて、前記画像ブロックの符号化モードを決定する符号化モード決定ステップと、

を備える符号化モード決定方法。

## 3 3.

画像ブロックの符号化モードを決定する符号化モード決定方法であって、

前記画像ブロックのフィールド構造ブロックおよびフレーム構造ブロックの各ブロックについてインター予測を行って、符号化コストを導出するインター予測ステップと、

前記インター予測ステップによる符号化コストに基づいて、前記画像ブロックの符号化ピクチャ構造を決定する符号化ピクチャ構造決定ステップと、

決定された前記符号化ピクチャ構造を有する各ブロックについてイントラ予測を行って、符号化コストを導出するイントラ予測ステップと、

前記インター予測による符号化コストと前記イントラ予測による符号化コストを比較して、決定された前記符号化ピクチャ構造を有する画像ブロックの各ブロックに対する符号化予測方式を決定する符号化予測方式決定ステップと、  
を備える符号化モード決定方法。

## 3 4.

画像ブロックの符号化モードを決定する符号化モード決定方法であって、前記画像ブロックのフィールド構造ブロックおよびフレーム構造ブロックのそれぞれのブロックに対して簡易な動き推定によって符号化コストを導出する簡易動き推定ステップと、

- 5 前記簡易動き推定ステップによる符号化コストに基づいて、前記画像ブロックのフィールド構造ブロックおよびフレーム構造ブロックの符号化コストを比較し、符号化ピクチャ構造を決定する符号化ピクチャ構造決定ステップと、を備える符号化モード決定方法。

### 35.

- 10 コンピュータにより、画像ブロックの符号化モードを複数候補の中から少なくとも1つに決定する符号化モード決定プログラムであって、前記符号化モード決定プログラムは、コンピュータに、各符号化モードによってそれぞれ得られる画像ブロックのパーティションである小ブロックに対する簡易な動き推定に基づいて、各符号化モードの符号化コストを導出する簡易動き推定ステップと、

前記簡易動き推定ステップによって導出された符号化コストに基づいて、前記複数の符号化モードから一部の符号化モードを選択する符号化モード選択ステップと、

- 20 前記一部の符号化モードの少なくとも一部の符号化モードによって得られる小ブロックに対する複雑な動き推定に基づいて、各符号化モードの符号化コストを導出する複雑動き推定ステップと、

前記複雑動き推定ステップによって導出された符号化コストに基づいて、前記画像ブロックの符号化モードを決定する符号化モード決定ステップと、を備える符号化モード決定方法を行わせるものである、

- 25 符号化モード決定プログラム。

### 36.

コンピュータにより、画像ブロックの符号化モードを決定する符号化モード決定方法を行うための符号化モード決定プログラムであって、

前記符号化モード決定プログラムは、コンピュータに、

前記画像ブロックのフィールド構造ブロックおよびフレーム構造ブロックの各ブロックについてインター予測を行って、符号化コストを導出するインター予測ステップと、

前記インター予測ステップによる符号化コストに基づいて、前記画像ブロック

5 の符号化ピクチャ構造を決定する符号化ピクチャ構造決定ステップと、

決定された前記符号化ピクチャ構造を有する各ブロックについてイントラ予測を行って、符号化コストを導出するイントラ予測ステップと、

前記インター予測による符号化コストと前記イントラ予測による符号化コストを比較して、決定された前記符号化ピクチャ構造を有する画像ロックの各ブロック

10 クに対する符号化予測方式を決定する符号化予測方式決定ステップと、

を備える符号化モード決定方法を行わせるものである、

符号化モード決定プログラム。

### 37.

コンピュータにより、画像ブロックの符号化モードを決定する符号化モード決定方法を行うための符号化モード決定プログラムであって、

前記符号化モード決定プログラムは、コンピュータに、

前記画像ブロックのフィールド構造ブロックおよびフレーム構造ブロックのそれぞれのブロックに対して簡易な動き推定によって符号化コストを導出する簡易動き推定ステップと、

20 前記簡易動き推定ステップによる符号化コストに基づいて、前記画像ブロックのフィールド構造ブロックおよびフレーム構造ブロックの符号化コストを比較し

、符号化ピクチャ構造を決定する符号化ピクチャ構造決定ステップと、

を備える符号化モード決定方法を行わせるものである、

符号化モード決定プログラム。

1/32

Fig. 1



Fig.2

2/32



Fig. 3

3/32



Fig. 4

4/32



5/32

Fig. 5



Fig. 6

6/32



7/32

Fig. 7



Fig. 8

8/32



Fig. 9

9/32



Fig. 10

10/32



11/32

Fig. 11



Fig. 12

12/32



Fig. 13

13/32



Fig. 14

14/32



Fig. 15



Fig. 16

16/32



17/32

Fig.17



Fig. 18

18/32



Fig. 19

19/32



Fig. 20

20/32



Fig.21

21/32



Fig. 22

22/32



Fig.23

23/32



24/32

Fig. 24



25/32

Fig. 25



Fig. 26

26/32



Fig.27

27/32



Fig.28

28/32



Fig. 29

29/32



Fig. 30

30/32



Fig. 31

31/32



Fig. 32

32/32



## INTERNATIONAL SEARCH REPORT

International application No.

PCT/JP2004/010903

## A. CLASSIFICATION OF SUBJECT MATTER

Int.Cl<sup>7</sup> H04N7/32

According to International Patent Classification (IPC) or to both national classification and IPC

## B. FIELDS SEARCHED

Minimum documentation searched (classification system followed by classification symbols)

Int.Cl<sup>7</sup> H04N7/24-7/68

Documentation searched other than minimum documentation to the extent that such documents are included in the fields searched

|                           |           |                            |           |
|---------------------------|-----------|----------------------------|-----------|
| Jitsuyo Shinan Koho       | 1922-1996 | Toroku Jitsuyo Shinan Koho | 1994-2004 |
| Kokai Jitsuyo Shinan Koho | 1971-2004 | Jitsuyo Shinan Toroku Koho | 1996-2004 |

Electronic data base consulted during the international search (name of data base and, where practicable, search terms used)

## C. DOCUMENTS CONSIDERED TO BE RELEVANT

| Category* | Citation of document, with indication, where appropriate, of the relevant passages                                                                                                                                    | Relevant to claim No.       |
|-----------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----------------------------|
| Y         | JP 9-65340 A (Hitachi, Ltd.),<br>07 March, 1997 (07.03.97),<br>Full text; Figs. 1 to 12<br>(Family: none)                                                                                                             | 1-7, 9, 12-15,<br>28-32, 35 |
| Y         | JP 11-243551 A (Mitsubishi Electric Corp.),<br>07 September, 1999 (07.09.99),<br>Par. Nos. [0029] to [0106]; Figs. 1 to 17<br>& US 2004/0202245 A1 & FR 2773295 B1<br>& CA 2256071 A1 & CN 1226782 A<br>& TW 398152 B | 1-7, 9, 12-37               |

 Further documents are listed in the continuation of Box C. See patent family annex.

|                                        |                                                                                                                                                                                                                                              |
|----------------------------------------|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| Special categories of cited documents: |                                                                                                                                                                                                                                              |
| "A"                                    | document defining the general state of the art which is not considered to be of particular relevance                                                                                                                                         |
| "E"                                    | earlier application or patent but published on or after the international filing date                                                                                                                                                        |
| "L"                                    | document which may throw doubts on priority claim(s) or which is cited to establish the publication date of another citation or other special reason (as specified)                                                                          |
| "O"                                    | document referring to an oral disclosure, use, exhibition or other means                                                                                                                                                                     |
| "P"                                    | document published prior to the international filing date but later than the priority date claimed                                                                                                                                           |
| "T"                                    | later document published after the international filing date or priority date and not in conflict with the application but cited to understand the principle or theory underlying the invention                                              |
| "X"                                    | document of particular relevance; the claimed invention cannot be considered novel or cannot be considered to involve an inventive step when the document is taken alone                                                                     |
| "Y"                                    | document of particular relevance; the claimed invention cannot be considered to involve an inventive step when the document is combined with one or more other such documents, such combination being obvious to a person skilled in the art |
| "&"                                    | document member of the same patent family                                                                                                                                                                                                    |

Date of the actual completion of the international search  
02 November, 2004 (02.11.04)Date of mailing of the international search report  
22 November, 2004 (22.11.04)Name and mailing address of the ISA/  
Japanese Patent Office

Authorized officer

Facsimile No.

Telephone No.

## INTERNATIONAL SEARCH REPORT

International application No.

PCT/JP2004/010903

## C (Continuation). DOCUMENTS CONSIDERED TO BE RELEVANT

| Category* | Citation of document, with indication, where appropriate, of the relevant passages                                                                                    | Relevant to claim No. |
|-----------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----------------------|
| Y         | JP 2000-102016 A (Victor Company Of Japan, Ltd.), 07 April, 2000 (07.04.00), Full text; Figs. 1 to 10 (Family: none)                                                  | 1-7, 9, 12-15, 32, 35 |
| Y         | JP 7-203452 A (NEC Corp.), 04 August, 1995 (04.08.95), Full text; Figs. 1 to 8 & US 5719630 A                                                                         | 4, 6, 7, 9, 12-15     |
| A         | Full text; Figs. 1 to 8 & US 5719630 A                                                                                                                                | 8                     |
| Y         | JP 2003-174653 A (Sony Corp.), 20 June, 2003 (20.06.03), Full text; Figs. 1 to 7 (Family: none)                                                                       | 16-22, 24-31, 33, 36  |
| Y         | WO 03/047272 A2 (GENERAL INSTRUMENT CORP.), 05 June, 2003 (05.06.03), Par. Nos. [0061] to [0068]; Figs. 6A to 10 & EP 1449385 A2 & US 2003/0099292 A1 & CA 2468087 A1 | 19-22, 26-31          |
| Y         | JP 2001-61149 A (KDD Kabushiki Kaisha), 06 March, 2001 (06.03.01), Par. No. [0033]; Fig. 8 & US 2002/0136301 A1                                                       | 23-31, 34, 37         |
| A         | JP 11-239352 A (Matsushita Electric Industrial Co., Ltd.), 31 August, 1999 (31.08.99), Full text; Figs. 1 to 12 & US 6353683 B1                                       | 10, 11                |

## A. 発明の属する分野の分類(国際特許分類(IPC))

Int. C17 H04N7/32

## B. 調査を行った分野

調査を行った最小限資料(国際特許分類(IPC))

Int. C17 H04N7/24-7/68

最小限資料以外の資料で調査を行った分野に含まれるもの

日本国実用新案公報 1922-1996年  
 日本国公開実用新案公報 1971-2004年  
 日本国登録実用新案公報 1994-2004年  
 日本国実用新案登録公報 1996-2004年

国際調査で使用した電子データベース(データベースの名称、調査に使用した用語)

## C. 関連すると認められる文献

| 引用文献の<br>カテゴリー* | 引用文献名 及び一部の箇所が関連するときは、その関連する箇所の表示                                                                                                                                | 関連する<br>請求の範囲の番号            |
|-----------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----------------------------|
| Y               | JP 9-65340 A (株式会社日立製作所)<br>1997.03.07, 全文, 第1-12図 (ファミリーなし)                                                                                                     | 1-7, 9, 12-15,<br>28-32, 35 |
| Y               | JP 11-243551 A (三菱電機株式会社)<br>1999.09.07,<br>段落【0029】-【0106】、第1-17図<br>& US 2004/0202245 A1<br>& FR 2773295 B1<br>& CA 2256071 A1<br>& CN 1226782 A & TW 398152 B | 1-7, 9, 12-37               |

 C欄の続きにも文献が列挙されている。 パテントファミリーに関する別紙を参照。

## \* 引用文献のカテゴリー

「A」特に関連のある文献ではなく、一般的技術水準を示すもの  
 「E」国際出願日前の出願または特許であるが、国際出願日以後に公表されたもの  
 「L」優先権主張に疑義を提起する文献又は他の文献の発行日若しくは他の特別な理由を確立するために引用する文献(理由を付す)  
 「O」口頭による開示、使用、展示等に言及する文献  
 「P」国際出願日前で、かつ優先権の主張の基礎となる出願

## の日の後に公表された文献

「T」国際出願日又は優先日後に公表された文献であって出願と矛盾するものではなく、発明の原理又は理論の理解のために引用するもの  
 「X」特に関連のある文献であって、当該文献のみで発明の新規性又は進歩性がないと考えられるもの  
 「Y」特に関連のある文献であって、当該文献と他の1以上の文献との、当業者にとって自明である組合せによって進歩性がないと考えられるもの  
 「&」同一パテントファミリー文献

## 国際調査を完了した日

02.11.2004

## 国際調査報告の発送日

22.11.2004

## 国際調査機関の名称及びあて先

日本国特許庁 (ISA/JP)

郵便番号 100-8915

東京都千代田区霞が関三丁目4番3号

特許庁審査官(権限のある職員)

畠中 高行

5P 9468

電話番号 03-3581-1101 内線 3580

| C(続き) 関連すると認められる文献 |                                                                                                                                                            |                          |
|--------------------|------------------------------------------------------------------------------------------------------------------------------------------------------------|--------------------------|
| 引用文献の<br>カテゴリー*    | 引用文献名 及び一部の箇所が関連するときは、その関連する箇所の表示                                                                                                                          | 関連する<br>請求の範囲の番号         |
| Y                  | JP 2000-102016 A (日本ビクター株式会社)<br>2000. 04. 07, 全文, 第1-10図 (ファミリーなし)                                                                                        | 1-7, 9, 12-15,<br>32, 35 |
| Y                  | JP 7-203452 A (日本電気株式会社)<br>1995. 08. 04, 全文, 第1-8図                                                                                                        | 4, 6, 7, 9,<br>12-15     |
| A                  | & US 5719630 A                                                                                                                                             | 8                        |
| Y                  | JP 2003-174653 A (ソニー株式会社)<br>2003. 06. 20, 全文, 第1-7図 (ファミリーなし)                                                                                            | 16-22, 24-31,<br>33, 36  |
| Y                  | WO 03/047272 A2<br>(GENERAL INSTRUMENT CORPORATION) 2003. 06. 05,<br>段落【0061】-【0068】，第6A-10図<br>& EP 1449385 A2<br>& US 2003/0099292 A1<br>& CA 2468087 A1 | 19-22, 26-31             |
| Y                  | JP 2001-61149 A (ケイディディ株式会社)<br>2001. 03. 06, 段落【0033】，第8図<br>& US 2002/0136301 A1                                                                         | 23-31, 34, 37            |
| A                  | JP 11-239352 A (松下電器産業株式会社)<br>1999. 08. 31, 全文, 第1-12図<br>& US 6353683 B1                                                                                 | 10, 11                   |